Проверка гипотезы о распределении пуассона

Образовательные онлайн сервисы: теория и практика

Решения типовых задач — Теория вероятностей

Проверка гипотезы о распределении Пуассона

Задача

Отдел технического контроля проверил п = 500 партий однотипных изделий и установил, что число Х нестандартных деталей в одной партии имеет эмпирическое распределение, приведенное в таблице.

x– число нестандартных изделий в одной партии, n – количество партий, содержащих х нестандартных изделий.

Требуется при уровне значимости проверить гипотезу о том, что случайная величина Х (число нестандартных изделий в одной партии) распределена по закону Пуассона.

Решение:

Находим выборочную среднюю

В качестве оценки параметра l распределения Пуассона выберем полученное значение выборочного среднего .

Расчет теоретических частот ведем по формуле

Расчетная таблица значений.

Прим. таблица Microsoft Excel. Параметры рассчитаны автоматически.

Малочисленные частоты можно объединить. Также объединяются и соответствующие им теоретические частоты.

Получили:
Число степеней свободы k = s – r – 1, т.к. проверяется гипотеза о распределении Пуассона (т.е. проверяется один параметр), то r = 1, k = s – 2 = 3 (s = 5, т.к. после исключения малочисленных частот в таблице осталось 5 строк)
По таблице получаем:

Ответ: поскольку , гипотеза о том, что случайная величина распределена по закону Пуассона может быть принята.

Рассмотрим применение в MS EXCEL критерия хи-квадрат Пирсона для проверки сложных гипотез.

В случае проверки сложных гипотез мы задаем только форму распределения, параметры распределения, в отличие от простой гипотезы, неизвестны. Из выборки сначала нужно оценить эти неизвестные параметры, затем вычислить статистику Х 2 (та же процедура, что и для простых гипотез).

Примечание: Начать знакомство с критерием согласия Пирсона Х 2 (хи-квадрат) рекомендуется в отношении простых гипотез см. статью Проверка простых гипотез критерием хи-квадрат Пирсона в MS EXCEL.

Читайте также  Сетевой идентификатор пользователя ps4

В случае сложной гипотезы, p-значение, которое мы сравниваем с уровнем значимости, рассчитывается с использованием Х 2 -распределения с L-k-1 степеней свободы, где k – количество оцениваемых параметров.

Если вероятность, того что случайная величина имеющая Х 2 -распределение с L-k-1 степенями свободы примет значение больше вычисленной статистики Х 2 , т.е. Х 2 L-k-1>Х 2 , меньше уровня значимости, то нулевая гипотеза отклоняется.

Приведем два примера проверки сложных гипотез.

Распределение Пуассона

Выдвигается гипотеза, что число дефектов в микросхемах имеет распределение Пуассона. Была исследована выборка из 50 микросхем.

На основании выборки оценим λ (лямбда) — единственный параметр распределения Пуассона (он равен среднему значению, см. файл примера лист Слож.гипотеза_Пуассон ). Используя оценку параметра распределения, вычислим теоретические частоты =ПУАССОН.РАСП(0;λ;ЛОЖЬ) .

Как видно из рисунка выше, случайная величина (количество дефектов в микросхеме) принимает 4 значения (четвертое значение соответствует случаю «3 и более» дефектов). Поэтому L=4, а число степеней свободы равно 4-1-1=2.

Вычислим значение статистики Х 2 , а затем p-значение, чтобы сравнить его с уровнем значимости 0,05. В нашем случае нулевая гипотеза о том, что число дефектов имеет распределение Пуассона не может быть отвергнута, т.к. p-значение (0,676) больше 0,05.

Обычно рекомендуется, чтобы каждый интервал содержал минимум 5 значений (Expected). В нашем случае это условие не соблюдается, т.к. для 3-х и более дефектов теоретическая частота меньше 2. Объединим интервалы «3 и более» и «2 дефекта» в один интервал.

Не забудем уменьшить на 1 число степеней свободы, т.к. у нас уменьшилось на 1 значение L. В итоге, p-значение также изменится (0,396), но у нас по прежнему не будет основания отвергнуть нулевую гипотезу.

Для изучения урожайности лекарственного растения поляна была разбита на 150 учётных площадок по 1 м 2 . При подсчёте количества растений на каждом из участков были получены следующие результаты:

Читайте также  Прошивка модема мегафон 4g m150 2

По выборке объёма n = 150 составьте дискретный ряд распределения числа растений на площадках. Постройте полигон частот.

Найдите среднее значение, выборочные дисперсию, среднее квадратическое отклонение, моду и медиану. При доверительной вероятности g = 0,99 определите доверительный интервал для генеральной средней.

Проверьте гипотезу о том, что количества растений на 1 м 2 имеют распределение Пуассона. Уровень значимости a = 0,05.

Видеоинструкция к онлайн решению через калькулятор "Группировка данных".

Ссылка на основную публикацию
Adblock
detector