ESTIMATION OF THE NUMBER OF SUMMANDS OF THE CENTRAL LIMIT THEOREM

Abstract


The problem of estimating the number of summands of random variables for a total normal distribution law or a sample average with a normal distribution is investigated. The Central limit theorem allows us to solve many complex applied problems using the developed mathematical apparatus of the normal probability distribution. Otherwise, we would have to operate with convolutions of distributions that are explicitly calculated in rare cases. The purpose of this paper is to theoretically estimate the number of terms of the Central limit theorem necessary for the sum or sample average to have a normal probability distribution law. The article proves two theorems and two consequences of them. The method of characteristic functions is used to prove theorems. The first theorem States the conditions under which the average sample of independent terms will have a normal distribution law with a given accuracy. The corollary of the first theorem determines the normal distribution for the sum of independent random variables under the conditions of theorem 1. The second theorem defines the normal distribution conditions for the average sample of independent random variables whose mathematical expectations fall in the same interval, and whose variances also fall in the same interval. The corollary of the second theorem determines the normal distribution for the sum of independent random variables under the conditions of theorem 2. According to the formula relations proved in theorem 1, a table of the required number of terms in the Central limit theorem is calculated to ensure the specified accuracy of approximation of the distribution of the values of the sample average to the normal distribution law. A graph of this dependence is constructed. The dependence is well approximated by a polynomial of the sixth degree. The relations and proved theorems obtained in the article are simple, from the point of view of calculations, and allow controlling the testing process for evaluating students ' knowledge. They make it possible to determine the number of experts when making collective decisions in the economy and organizational management systems, to conduct optimal selective quality control of products, to carry out the necessary number of observations and reasonable diagnostics in medicine.

Full Text

Введение Предельные теоремы составляют основу современной теории вероятностей. Среди них особое место по важности практического применения занимает центральная предельная теорема (ЦПТ). Она позволяет решать многие задачи в экономических, социальных, технических, военных, медицинских, биологических системах, где рассматриваются суммы случайных величин. Примерами применения ЦПТ являются: 1) обоснование результатов измерений и наблюдений; 2) моделирование действия многих факторов на изучаемый процесс или явление; 3) статистическая теория принятия решений; 4) оценка рисков, управление рисками; 5) организация страхования; 6) выборочный контроль и оценка качества продукции; 7) социологические исследования. В научных публикациях рассматриваются преимущественно две проблемы ЦПТ: асимптотическое поведение распределений суммы случайных величин, например в работах [1-3], и скорость сходимости к предельному закону [4-6]. Новыми направлениями в данной области знаний являются исследование сумм зависимых случайных величин и функций от них [7], обоснование многомерной центральной предельной теоремы для зависимых случайных векторов [8], рассмотрение предельных теорем для случайных матриц с зависимыми элементами [9]. Методология проверки адекватности центральной предельной теоремы на основе связи этой теоремы и теоремы Бернулли изложена в статье [10]. Один важный для практики вопрос не нашел должного простого теоретического обоснования. Речь идет об оценке числа слагаемых центральной предельной теоремы так, чтобы сумма была распределена по нормальному закону. Эта задача решается в работах [11-13] путем моделирования на больших наборах данных. В работе [11] отмечается, что при использовании трех слагаемых график плотности вероятности начинает приближаться к нормальному; при 30 и более слагаемых график плотности вероятности близок к теоретическому. Дальнейшее увеличение не приводит к существенным изменениям характеристик. Целью данной работы является теоретическая оценка числа слагаемых центральной предельной теоремы, необходимых для того, чтобы сумма имела нормальный закон распределения вероятностей. 1. Постановка задачи оценки числа слагаемых центральной предельной теоремы В прикладной области часто возникает задача оценки числа слагаемых случайных величин для суммарного нормального закона распределения или выборочной средней, имеющей нормальное распределение. Это может быть оценка необходимого числа вопросов для проверки знаний обучаемых при тестировании, определение числа экспертов для формирования обоснованной коллективной оценки, задание числа выборочных проверок при контроле качества продукции и т.д. В теоретических аспектах это формулируется следующим образом: для достаточно большого числа слагаемых n при определенных условиях сумма или средняя выборочная будет иметь нормальное распределение. Однако это звучит очень неопределенно. В работах [14, 15] конкретизируется, что, как показывает практика, уже при n = 10 суммарное распределение будет нормальным. В связи с этим возникает задача оценки числа n, например в виде функциональной зависимости n от параметров, связанных с описанием закона распределения суммы или средней выборочной. 2. Основные теоремы и следствия Докажем следующее утверждение. Теорема 1. При сложении n независимых слагаемых случайных величин, имеющих одинаковые математические ожидания и дисперсии их средняя выборочная будет иметь с точностью нормальный закон распределения при Здесь символ означает целую часть числа . Доказательство. Оценим значение с использованием метода характеристических функций. Не нарушая общности, рассмотрим непрерывные случайные величины. Обозначим через характеристическую функцию случайной величины . Здесь t - значение некоторой случайной величины T. Как будет показано далее, случайная величина будет иметь нормальное распределение с и Характеристическая функция случайной величины запишется в виде (1) так как величины независимы. Не нарушая общности, можно положить, . Будем считать, что Если это не так, то вместо будем рассматривать случайную величину . Очевидно если будет иметь нормальное распределение, то также будет иметь нормальное распределение. Представим функцию рядом Маклорена. Имеем Найдем вторую производную: . Найдем остаточную сумму ряда : . Поскольку получаем Следовательно, . Тогда . (2) Считаем, что и . Это допущение необходимо для определения функции . Следовательно, . (3) Прологарифмируем выражение (2): . Разложим полученное выражение в ряд Маклорена: Погрешность данного ряда не превосходит величины , (4) так как Потребуем, чтобы в формуле (4) при выполнялось условие , где - сколь угодно малое положительное число. Поскольку , . Тогда (5) Из формул (3) и (5) находим Итак, с точностью , т.е. Отсюда (6) и Следовательно, относительная погрешность вычисления равна . При этом . Тогда и с учетом формулы (6) и формулы из работы [14] получаем . (7) Из формулы (6) следует, что имеет нормальное распределение и с точностью 0,0027. Имеем Погрешность равна Относительная погрешность при этом составит , т.е. 0,28 %. Отметим, что . Следовательно, можно утверждать, что с точностью средняя арифметическая случайных величин при (8) имеет нормальное распределение. В таблице для данного показаны соответствующие значения . Зависимость от 0,001 0,0015 0,002 0,0028 0,003 0,004 0,005 0,01 0,1 0,5 0,7 0,9 23 20 18 16 16 15 14 11 6 4 3 3 График зависимости от представлен на рисунке. Зависимость от хорошо аппроксимируется полиномом шестой степени (получено с помощью средства MS Excel «Линия тренда») следующего вида: Коэффициент детерминации для полученной зависимости составляет , что свидетельствует о хорошем подборе зависимости. Рис. Зависимость от Следствие 1. Сумма n независимых случайных величин, имеющих одинаковые математические ожидания и одинаковые дисперсии, имеет нормальный закон распределения при , где удовлетворяет равенству (8). Данное следствие, очевидно, следует из доказанной теоремы, поскольку если имеет нормальное распределение при , то также будет иметь нормальное распределение при тех же значениях n. Теорема 2. Средняя выборочная независимых случайных величин, математические ожидания которых попадают в один и тот же интервал , а дисперсии попадают в один и тот же интервал , имеет нормальное распределение при , где удовлетворяют условию (8), при этом соответствует паре , - паре , - паре , - паре . Доказательство. Каждую случайную величину считаем нормированной случайной величиной. Далее используем метод, разработанный в теореме 1 для разных пар значений математического ожидания и среднего квадратического отклонения: , , , . Находим соответствующие значения . Из них выбираем максимальное, которое будет определять необходимое число слагаемых, определяющих нормально распределенную среднюю выборочную. Следствие 2. Сумма независимых случайных величин, математические ожидания которых попадают в один и тот же интервал , а дисперсии попадают в один и тот же интервал , имеет нормальное распределение при , где удовлетворяют условию теоремы 2. Заключение В статье доказаны две теоремы и получены два следствия из них. Получены формульные условия для необходимого числа слагаемых, при которых средняя выборочная и суммы слагаемых центральной предельной теоремы будут иметь с заданной точностью нормальный закон распределения. Дальнейшим развитием исследований является определение необходимого числа слагаемых для зависимых случайных величин, а также случайных векторов и матриц.

About the authors

A. V Ganicheva

Tverskaya State Agricultural Academy

References

  1. Золотарев В.М. Современная теория суммирования независимых случайных величин. - М.: Наука, 1986. - 415 с.
  2. Сенаторов В.В. О реальной точности аппроксимаций в центральной предельной теореме // Сибирский математический журнал. - 2011. - Т. 52, № 4. - С. 913-935.
  3. Шевцова И.Г. Точность нормальной аппроксимации: методы оценивания и новые результаты. - М.: АРГАМАК-МЕДИА, 2016. - 380 с.
  4. Нефедова Ю.С., Шевцова И.Г. О неравномерных оценках скорости сходимости в центральной предельной теореме // Теория вероятностей и ее применения. - 2012. - Т. 57, № 1. - С. 62-97.
  5. Королев В.Ю., Попов C.B. Уточнение оценок скорости сходимости в центральной предельной теореме при отсутствии моментов порядков, больших второго // Теория вероятностей и ее применения. - 2011. - Т. 56, № 4. - С. 797-805.
  6. Попов С.В. Уточнение неравномерных оценок скорости сходимости в центральной предельной теореме при существовании моментов не выше второго // Информатика и ее применения. - 2012. - Т. 6, № 1. - С. 7-11.
  7. Гринь А.Г. О центральной предельной теореме для симметрических функций от зависимых величин // Математические структуры и моделирование. - 2017. - № 1(41). - С. 5-11.
  8. Волгин А.В. Оценка скорости сходимости в многомерной центральной предельной теореме // Прикладная дискретная математика. - 2017. - № 36. - С. 13-24.
  9. Гетце Ф., Наумов А.А., Тихомиров А.Н. Предельные теоремы для двух классов случайных матриц с зависимыми элементами // Теория вероятностей и ее применения. - 2014. - Т. 59, № 1. - С. 61-80.
  10. Резников В.М. К методологии проверки адекватности центральной предельной теоремы // Философия науки. - 2012. - № 3 (54). - С. 81-91.
  11. Пименов С.Ю., Тинаев В.В. Применение центральной предельной теоремы для компьютерного моделирования случайных сигналов // Наука и образование: новое время. - 2017. - № 2 (19). - С. 227-231.
  12. Парахин А.С. Численная проверка центральной предельной теоремы // Математика, информатика, компетентностный подход к обучению в вузе и школе: материалы Всерос. науч.-практ. конф., г. Курган, 14 апреля 2015 г. - Курган: Изд-во КГУ, 2015. - С. 24-27.
  13. Цурганов А.Г., Макеенко Г.И. Простая иллюстрация центральной предельной теоремы в медицинской статистике // Достижения фундаментальной, клинической медицины и фармации: материалы 71-й науч. сессии сотр. ун-та, г. Витебск, 27-28 января 2016 г. / ВГМУ. - Витебск, 2016. - С. 330-331.
  14. Вентцель Е.С. Теория вероятностей: учеб. - М.: Изд-во физ.-мат. лит., 2003. - 564 с.
  15. Ганичева А.В. Теория вероятностей: учеб. пособие. - СПб.: Лань, 2017. - 144 с.

Statistics

Views

Abstract - 64

PDF (Russian) - 31

Refbacks

  • There are currently no refbacks.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies