Как посчитать дисперсию случайной величины

Как посчитать дисперсию случайной величины

В создании этой статьи участвовала наша опытная команда редакторов и исследователей, которые проверили ее на точность и полноту.

Команда контент-менеджеров wikiHow тщательно следит за работой редакторов, чтобы гарантировать соответствие каждой статьи нашим высоким стандартам качества.

Количество источников, использованных в этой статье: 8. Вы найдете их список внизу страницы.

Количество просмотров этой статьи: 104 480.

Дисперсия случайной величины является мерой разброса значений этой величины. Малая дисперсия означает, что значения сгруппированы близко друг к другу. Большая дисперсия свидетельствует о сильном разбросе значений. Понятие дисперсии случайной величины применяется в статистике. Например, если сравнить дисперсию значений двух величин (таких как результаты наблюдений за пациентами мужского и женского пола), можно проверить значимость некоторой переменной. [1] X Источник информации Также дисперсия используется при построении статистических моделей, так как малая дисперсия может быть признаком того, что вы чрезмерно подгоняете значения. [2] X Источник информации

  • Например, проанализируем количество булочек, проданных в кафе за 6 дней, взятых в случайном порядке. Выборка имеет следующий вид: 17, 15, 23, 7, 9, 13. Это выборка, а не совокупность, потому что у нас нет данных о проданных булочках за каждый день работы кафе.
  • Если вам дана совокупность, а не выборка значений, перейдите к следующему разделу.
  • В нашем примере сложите значения в выборке: 15 + 17 + 23 + 7 + 9 + 13 = 84Теперь результат разделите на количество значений в выборке (в нашем примере их 6): 84 ÷ 6 = 14. Выборочное среднее x̅ = 14.
  • Выборочное среднее – это центральное значение, вокруг которого распределены значения в выборке. Если значения в выборке группируются вокруг выборочного среднего, то дисперсия мала; в противном случае дисперсия велика.
  • В нашем примере: x 1 - x̅ = 17 - 14 = 3 x 2 - x̅ = 15 - 14 = 1 x 3 - x̅ = 23 - 14 = 9 x 4 - x̅ = 7 - 14 = -7 x 5 - x̅ = 9 - 14 = -5 x 6 - x̅ = 13 - 14 = -1
  • Правильность полученных результатов легко проверить, так как их сумма должна равняться нулю. Это связано с определением среднего значения, так как отрицательные значения (расстояния от среднего значения до меньших значений) полностью компенсируются положительными значениями (расстояниями от среднего значения до больших значений).
  • В нашем примере:( x 1 - x̅) 2 = 3 2 = 9 ( x 2 - x̅) 2 = 1 2 = 1 9 2 = 81(-7) 2 = 49(-5) 2 = 25(-1) 2 = 1
  • Вы нашли квадрат разности ( x i - x̅) 2 для каждого значения в выборке.
  • В нашем примере: 9 + 1 + 81 + 49 + 25 + 1 = 166.
    В нашем примере выборка включает 6 значений, то есть n = 6.Дисперсия выборки = s 2 = 166 6 − 1 =
  • В нашем примере стандартное отклонение выборки: s = √33,2 = 5,76.
  • В некоторой комнате находятся 6 аквариумов. В каждом аквариуме обитает следующее количество рыб: x 1 = 5 x 2 = 5 x 3 = 8 x 4 = 12 x 5 = 15 x 6 = 18
  • Имейте в виду, что средние величины не всегда вычисляются как среднее арифметическое.
  • В нашем примере среднее значение совокупности: μ = 5 + 5 + 8 + 12 + 15 + 18 6 = 10,5
  • В нашем примере: x 1 - μ = 5 - 10,5 = -5,5 x 2 - μ = 5 - 10,5 = -5,5 x 3 - μ = 8 - 10,5 = -2,5 x 4 - μ = 12 - 10,5 = 1,5 x 5 - μ = 15 - 10,5 = 4,5 x 6 - μ = 18 - 10,5 = 7,5
  • В нашем примере:( x i - μ) 2 для каждого значения совокупности (от i = 1 до i = 6):(-5,5) 2 = 30,25(-5,5) 2 = 30,25(-2,5) 2 = 6,25(1,5) 2 = 2,25(4,5) 2 = 20,25(7,5) 2 = 56,25
    В нашем примере:Дисперсия совокупности = 30 , 25 + 30 , 25 + 6 , 25 + 2 , 25 + 20 , 25 + 56 , 25 6 = 145 , 5 6 =
  • Находим разность между каждым значением и средним значением совокупности, а затем возводим каждую разность в квадрат, то есть получаем ( x 1 - μ) 2 , ( x 2 - μ) 2 и так далее вплоть до ( x n - μ) 2 , где x n – последнее значение в генеральной совокупности.
  • Для вычисления среднего значения полученных результатов нужно найти их сумму и разделить ее на n:( ( x 1 - μ) 2 + ( x 2 - μ) 2 + . + ( x n - μ) 2 ) / n
  • Теперь запишем приведенное объяснение с использованием переменных: (∑( x i - μ) 2 ) /n и получим формулу для вычисления дисперсии совокупности.
  • Дисперсию довольно сложно интерпретировать, поэтому в большинстве случаев она вычисляется как промежуточная величина, которая необходима для нахождения стандартного отклонения.
  • При вычислении дисперсии выборки деление на n-1, а не просто на n, называется коррекцией Бесселя. Дисперсия выборки представляет собой только оценочное значение дисперсии генеральной совокупности, при этом выборочное среднее смещено, чтобы соответствовать этому оценочному значению. Коррекция Бесселя устраняет такое смещение. [9] X Источник информации Это связано с тем, что при анализе n – 1 значения использование n-го значения уже ограничено, так как только определенные значения приводят к выборочному среднему (x̅), которое используется в формуле для вычисления дисперсии. [10] X Источник информации

Дополнительные статьи

  1. ↑http://sphweb.bumc.bu.edu/otlt/MPH-Modules/BS/BS704_HypothesisTesting-ANOVA/BS704_HypothesisTesting-Anova_print.html
  2. ↑http://insidebigdata.com/2014/10/22/ask-data-scientist-bias-vs-variance-tradeoff/
  3. ↑https://www.youtube.com/watch?v=VgKHjVDK0uM
  4. ↑http://stattrek.com/statistics/notation.aspx
  5. ↑http://www.mathsisfun.com/data/standard-deviation.html
  6. ↑https://www.youtube.com/watch?v=sOb9b_AtwDg
  7. ↑https://www.youtube.com/watch?v=sOb9b_AtwDg
  8. ↑https://www.youtube.com/watch?v=VgKHjVDK0uM
  9. ↑http://datapigtechnologies.com/blog/index.php/understanding-standard-deviation-2/

Об этой статье

В создании этой статьи участвовала наша опытная команда редакторов и исследователей, которые проверили ее на точность и полноту.

Команда контент-менеджеров wikiHow тщательно следит за работой редакторов, чтобы гарантировать соответствие каждой статьи нашим высоким стандартам качества. Количество просмотров этой статьи: 104 480.

📎📎📎📎📎📎📎📎📎📎