![]() |
Здравствуйте, гость ( Вход | Регистрация )
![]() |
h7net |
![]()
Сообщение
#1
|
Школьник ![]() Группа: Продвинутые Сообщений: 11 Регистрация: 16.4.2009 Город: Ростов-на-Дону Вы: другое ![]() |
Добрый день, есть промоделированные результаты выполнения некой функции. В результате 1000 итераций получена выборка. Предлоложительно выборка подчиняется нормальному закону распределения, разумеется это надо доказать. Проштудировав набор литературы я выяснил, что для этого нужно расчитать критерий хи квадрат(критерий Пирсона). Для подсчета критерия мне нужны эмпирические частоты выборки и теоретические частоты выборки. Если с первыми все понятно, то про то, как найти вторые я понятия не имею(везде есть формулы, но примеры я нашел только для равномерного распределения). Почитал вот тут http://www.prepody.ru/topic4146.html про подобную задачу, но совершенно не понял как в данном примере нашли показатели теоретической частоты.
|
![]() ![]() |
Juliya |
![]()
Сообщение
#2
|
Старший преподаватель ![]() ![]() ![]() ![]() ![]() Группа: Активисты Сообщений: 1 197 Регистрация: 4.11.2008 Город: Москва Вы: преподаватель ![]() |
Прежде всего, Вам нужно построить интервальный ряд.
Построение интервального вариационного ряда распределения включает следующие этапы. 1. Определение среди имеющихся наблюдений минимального и максимального значения признака. 2. Определение размаха варьирования признака R= xmax -xmin 3. Определение длины интервала по формуле Стерджеса: h=R/(1+3,32*lgn), где n – объем выборки 4. Определение граничных значений интервалов (ai ; bi). Так как xmin и xmax являются случайными величинами, рекомендуется отступить влево от нижнего предела варьирования (xmin). За нижнюю границу первого интервала предлагается принимать величину, равную xmin-h/2 Если оказывается, что a1<0, хотя по смыслу величина Х не может принимать отрицательные значения, то приниют a1=0. Верхняя граница первого интервала b1= a1+h. Тогда, если bi - верхняя граница i-го интервала (причем a(i+1)=bi), то b2=a2+h, b3=a3+h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше xmax. 5. Группировка результатов наблюдения Подсчитываете, сколько значений попало в каждый интервал. Можно вручную, предварительно ранжировав данные, можно с помощью функции ЧАСТОТА Excel. Это и будут эмпирические частоты. Вы построили интервальный ряд. Прошу прощения, увлеклась эмпирическими - у Вам с ними и так все понятно.. (IMG:style_emoticons/default/smile.gif) Теперь по формулам нормального закона распределения, с помощью функции Лапласа, находите вероятность попадания в каждый интервал, умножаете на n, округляете - и получаете теоретические частоты. За математическое ожидание и среднеквадратическое отклонение принимают их выборочные характеристики - среднее арифметическое и выборочное среднеквадратическое отклонение. Ну, и наконец, с помощью критерия согласия Пирсона проверяете, подчиняется ли Ваша выборка проверяемому закону распределения. Ps а можно легко и быстро прогнать данные в каком-нибудь хорошем статистическом пакете (раз это Вам нужно как промежуточный результат) - например, Stаtistica или SPSS, и за 1 минуту получить и критерий Пирсона, и критерий Колмогорова-Смирнова.. А заодно попробовать подогнать и другие распределения...(IMG:style_emoticons/default/smile.gif) |
h7net |
![]()
Сообщение
#3
|
Школьник ![]() Группа: Продвинутые Сообщений: 11 Регистрация: 16.4.2009 Город: Ростов-на-Дону Вы: другое ![]() |
Прежде всего, Вам нужно построить интервальный ряд. Построение интервального вариационного ряда распределения включает следующие этапы. 1. Определение среди имеющихся наблюдений минимального и максимального значения признака. 2. Определение размаха варьирования признака R= xmax -xmin 3. Определение длины интервала по формуле Стерджеса: h=R/(1+3,32*lgn), где n – объем выборки 4. Определение граничных значений интервалов (ai ч bi). Так как xmin и xmax являются случайными величинами, рекомендуется отступить влево от нижнего предела варьирования (xmin). За нижнюю границу первого интервала предлагается принимать величину, равную xmin-h/2 Если оказывается, что a1<0, хотя по смыслу величина Х не может принимать отрицательные значения, то приниют a1=0. Верхняя граница первого интервала b1= a1+h. Тогда, если bi - верхняя граница i-го интервала (причем a(i+1)=bi), то b2=a2+h, b3=a3+h и т.д. Построение интервалов продолжается до тех пор, пока начало следующего по порядку интервала не будет равным или больше xmax. 5. Группировка результатов наблюдения Подсчитываете, сколько значений попало в каждый интервал. Можно вручную, предварительно ранжировав данные, можно с помощью функции ЧАСТОТА Excel. Это и будут эмпирические частоты. Вы построили интервальный ряд. Прошу прощения, увлеклась эмпирическими - у Вам с ними и так все понятно.. (IMG:style_emoticons/default/smile.gif) Теперь по формулам нормального закона распределения, с помощью функции Лапласа, находите вероятность попадания в каждый интервал, умножаете на n, округляете - и получаете теоретические частоты. За математическое ожидание и среднеквадратическое отклонение принимают их выборочные характеристики - среднее арифметическое и выборочное среднеквадратическое отклонение. Ну, и наконец, с помощью критерия согласия Пирсона проверяете, подчиняется ли Ваша выборка проверяемому закону распределения. Ps а можно легко и быстро прогнать данные в каком-нибудь хорошем статистическом пакете (раз это Вам нужно как промежуточный результат) - например, Stаtistica или SPSS, и за 1 минуту получить и критерий Пирсона, и критерий Колмогорова-Смирнова.. А заодно попробовать подогнать и другие распределения...(IMG:style_emoticons/default/smile.gif) Спасибо большое, я вроде бы решил, правда не был уверен в правильности решения, но вы развеяли сомнения. У меня получилась в итоге вот такая таблица: 99,779 102,98 64 0,06028913+0,00571849 60,28912994 0,228408614 102,98 104,58 92 0,093876326 93,87632608 0,037502528 104,58 106,18 171 0,154427009 154,4270087 1,778601051 106,18 107,78 200 0,196698547 196,6985475 0,055412655 107,78 109,38 184 0,194001436 194,0014355 0,515608108 109,38 110,98 159 0,14816106 148,1610597 0,792938627 110,98 112,59 64 0,087989415 87,98941508 6,540468932 112,59 117,39 66 0,057865679+0,000972908 57,86567879 1,143461599 Хи квадрат в итоге: 11,09240211 Хотелось бы выяснить, правильно ли я все делаю. Первый и второй столбцы - это диапазоны в выборке. Третий столбец - эмпирические частоты. Четвертый столбец - это теоретическая вероятность расчитаная по формуле: НОРМРАСП(значение диапазона из второго столбца;среднее арифметеское выборки;стандартное отклонение выборки;1)-НОРМРАСП(начение диапазона из первого столбца;среднее арифметеское выборки;стандартное отклонение выборки;1). Соответственно в пятом столбце - теоретические частоты(произведение объема выборки на вероятность). Последний столбец - критерий хи квадрат, по формуле: (Третий столбец - Пятый столбец)^2/Пятый столбец. В итоге получается искомое значение: 11,09240211. Теперь у меня ряд вопросов: В теме, которую я просмотрел(ссылку я приводил) сказано, что нужно добавлять к этому еще 2 интервала, у меня они расчитаны как НОРМРАСП(99,779;среднее арифметеское выборки;стандартное отклонение выборки;1) и 1-НОРМРАСП(117,39;среднее арифметеское выборки;стандартное отклонение выборки;1). Я прибавляю эти вероятности к значению последнего и первого столбца, после этого сходится сумма теоретических вероятностей и кол-во операций(1000). Подскажите в таком случае у меня количество интервалов будет составлять 10 или все таки 8? И для определения степеней свободы мне нужно отнимать от кол-ва интервалов - 2 или 3? То есть я смотрю критическое значение хи квадрата для значения а=0,05 и r=5 или r=7? Подскажите как правильно определить степени свободы? Плюс такой вопрос. Мой научный руководитель, сказал, чтобы после расчета хи квадрата, я просчитал время выполнения моих функций с помощью функции Ла-Пласса. Как я понял - НОРМРАСП - это и есть эта функция, только вот, что я должен с ее помощью посчитать? И главное как? Вероятность выполнения моей функции за определенное время с какой-то вероятностью? Как это правильно сделать? P.S. Извиняюсь заранее за может быть дурацкие вопросы, но теорией вероятности мне пришлось заняться спустя 5 лет после того, как я закончил универ, поэтому и разбираться приходится заново и почти с нуля. |
Juliya |
![]()
Сообщение
#4
|
Старший преподаватель ![]() ![]() ![]() ![]() ![]() Группа: Активисты Сообщений: 1 197 Регистрация: 4.11.2008 Город: Москва Вы: преподаватель ![]() |
И для определения степеней свободы мне нужно отнимать от кол-ва интервалов - 2 или 3? Число степеней свободы=число интервалов - число оцениваемых по выборке параметров распределения (у нормального их 2)-1. Поэтому у Вас Число степеней свободы=число интервалов - 3. У Вас очень тяжело разобраться в Ваших записях, лучше табличку дать как картинку, а то не очень понятно... И какие у вас получились среднее и ско? Вообще, посмотрела -все похоже на правду.. Вот только насчет прибавления 2-х интервалов тоже не поняла - что имеется в виду. Для того, чтобы сумма частот была равна исходной. нужно теоретическую кривую строить на всей числовой оси - т.е. за первое значение первого интервала и за последнее значение последнего интервала принимать не их значения, а соответственно плюс и минус бесконечность. Тогда все обычно получается... А, видимо, того же и добиваются тем, что Вы сказали.. с помощью функции Ла-Пласса. (IMG:style_emoticons/default/blush.gif) Лаплас (Laplace) Пьер Симон (1749-1827), французский астроном, математик, физик, иностранный почетный член Петербургской АН (1802). Функция Лапласа имеет разные виды, я тут в какой-то теме приводила.... вот: http://www.prepody.ru/topic5367s20.html Не очень поняла. что Вам надо с её помощью просчитать.. Это функция, с помощью которой находятся значения функции распределения и любые вероятности попадания в интервал для нормальной СВ. |
![]() ![]() |
![]() |
Текстовая версия | Сейчас: 25.5.2025, 12:02 |
Зеркало сайта Решебник.Ру - reshebnik.org.ru