Проверка гипотезы о нормальном распределении - Образовательный студенческий форум

Решебник.Ру Правила форума

Помощь Поиск Пользователи Календарь

Здравствуйте, гость ( Вход | Регистрация )

Образовательный студенческий форум > Высшая математика > Теория вероятностей

Проверка гипотезы о нормальном распределении

Опции

KEA	25.11.2008, 18:50 Сообщение #1
Школьник Группа: Продвинутые Сообщений: 25 Регистрация: 13.6.2007 Город: Раменское	Дана выборка из 200 чисел. Для вычисления всех необходимиых теоретических и эмпирических значений ее надо было разбить на интервалы. Для нахождения количества интервалов нашла формулу:m=1+3,32lnn (у меня n=200)У меня получилось приблизительно 19, но для удобства я взяла 20. Не слишком ли много интервалов? В другом источнике говорится , что для такой выборки рекомендуется брать от 10 до 12 интервалов. Вопрос1:Сколько интервалов лучше взять? Вопрос2: В решениях некоторых задач на проверку гипотезы говорится, что интервалы, в которые попало мало значений, надо объединять. Обязательно ли это надо делать? И как это делать? Снова разбивать на равные интервалы, но большей длины? Влияет ли это на исход задачи. У меня получилось,при количестве интервалов 20, что в некоторые значения совсем не попали. Вопрос3:А значение Х-квадрат получилось, на мой взгляд, очень большим, почти в 10 раз большее критического. Может ли такое быть?

Ответов

KEA	25.11.2008, 20:45 Сообщение #2
Школьник Группа: Продвинутые Сообщений: 25 Регистрация: 13.6.2007 Город: Раменское	Я вроде считала, что получается нормальное распределение. Судила по графикам теоретических и эмпирических значений. Уже пересчитала для 12 интервалов. Разницу получила поменьше, но все равно достаточно большую. Может я неправильно вычисляю значения теоретических частот. Я их вычисляла так: Вероятность попасть в промежуток от c до b равна НОРМРАСП(b;a;σ;истина)-НОРМРАСП(с;a;σ;истина), где а-матожидание ,σ-станд отклонение. И все-таки о длинах промежутков. Я просмотрела достаточно много решений похожих задач. Во всех них длины берутся одинаковые. И еще один вопрос хотелось бы для себя уточнить. Для вычисления оценки дисперсии существуют две формулы, которые отличаюьтся друг от друга тем, что в одной сумма делится на n, а в другой - на n-1.В справке говорится что одна работает для генеральной совокупности, а другая для выброки из ненеральной совокупоности. Все-таки какую формулу надо использовать?

malkolm	26.11.2008, 7:38 Сообщение #3
Старший преподаватель Группа: Преподаватели Сообщений: 2 167 Регистрация: 14.6.2008 Город: Н-ск Вы: преподаватель	Цитата(KEA @ 26.11.2008, 2:45) Я вроде считала, что получается нормальное распределение. Судила по графикам теоретических и эмпирических значений. Уже пересчитала для 12 интервалов. Разницу получила поменьше, но все равно достаточно большую. Может я неправильно вычисляю значения теоретических частот. Я их вычисляла так: Вероятность попасть в промежуток от c до b равна НОРМРАСП(b;a;σ;истина)-НОРМРАСП(с;a;σ;истина), где а-матожидание ,σ-станд отклонение. Правильно считаете. Приведите значения: 12 теоретических частот, 12 выборочных частот, значение статистики критерия, ну и критическое значение статистики хи-квадрат (сколько берёте степеней свободы, какой размер критерия). Цитата(KEA @ 26.11.2008, 2:45) И все-таки о длинах промежутков. Я просмотрела достаточно много решений похожих задач. Во всех них длины берутся одинаковые. Моё дело дать совет (IMG:style_emoticons/default/wink.gif) В решении учебных задач можно делать что угодно. Но на практике результаты такой проверки гипотез могут оказаться далёкими от истины. Вы строите критерий, размер которого (вероятность ошибки 1 рода) должна быть α. На самом деле критерий хи-квадрат асимптотический, его размер лишь приближается к α с ростом объёма выборки. То, насколько реальная вероятность ошибки (реальный размер критерия) близок к предполагаемому, зависит в числе многих причин и от самого маленького из значений np(j), где p(j) - теоретическая вероятность j-го интервала группировки. Чем меньше это np(j), тем дальше реальное распределение статистики критерия от того распределения хи-квадрат, с которым мы его сравниваем. Поэтому если у нас попадутся интервалы маленьких вероятностей, может случиться страшное: мы думаем, отвергая основную гипотезу, что шансов ошибиться у нас, например, 5% (α=0,05), а их реально 1% или 15%. Поэтому при использовании критерия хи-квадрат есть обязательная рекомендация: интервалы должны быть такими, чтобы все n*p(j) были не менее 5 или 6. Для простоты эту рекомендацию о теоретичеких частотах превращают в рекомендацию о частотах выборки - число попавших в интервалы должно быть не менее 5 или 6. Но лучше посмотреть на свои интервалы: если хоть один из этих 12 имеет слишком малую вероятность, интервалы нужно менять (объединять, а лучше переразбить так, чтобы в центре были короткими, с краёв длинными). Цитата(KEA @ 26.11.2008, 2:45) И еще один вопрос хотелось бы для себя уточнить. Для вычисления оценки дисперсии существуют две формулы, которые отличаюьтся друг от друга тем, что в одной сумма делится на n, а в другой - на n-1.В справке говорится что одна работает для генеральной совокупности, а другая для выброки из ненеральной совокупоности. Все-таки какую формулу надо использовать? Безразлично. Поскольку и при той, и при другой выборочной дисперсиях статистика критерия лишь приближённо имеет распределение хи-квадрат. Тем более, что при n=200 величины 1/200 и 1/199 отличаются непринципиально. Обычно берут смещённую дисперсию 1/n ∑ (X_i - X_ср)^2.

Сообщений в этой теме

KEA Проверка гипотезы о нормальном распределении 25.11.2008, 18:50

malkolm Вопрос 1. m=1+3,32lg n, а не ln n, т.е. логарифм т... 25.11.2008, 19:59

KEA Я вроде считала, что получается нормальное распред... 25.11.2008, 20:45

malkolm Я вроде считала, что получается нормальное распре... 26.11.2008, 7:38

KEA 1 -0,9 -0,48 19 17,11776 0,206968 2 -0,48 -0,06 47... 26.11.2008, 18:30

malkolm Вы правильно считаете статистику критерия и критич... 26.11.2008, 20:56

KEA Крайние интервалы объединила, но не поняла, как вы... 26.11.2008, 21:48

KEA С вероятностями в крайних интервалах разобралась. ... 27.11.2008, 0:43

« Предыдущая тема · Теория вероятностей · Следующая тема »

1 чел. читают эту тему (гостей: 1, скрытых пользователей: 0)

Пользователей: 0

Режим отображения: Переключить на: Стандартный · Переключить на: Линейный · Древовидный

Подписка на тему · Сообщить другу · Версия для печати · Подписка на этот форум

Текстовая версия

Сейчас: 3.8.2025, 14:15

Книжки в помощь: "Сборник заданий по высшей математике" Кузнецов Л.А., "Сборник заданий по высшей математике" Чудесенко В.Ф., "Индивидуальные задания по высшей математике" Рябушко А.П., и другие.

Зеркало сайта Решебник.Ру - reshebnik.org.ru