Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Образовательный студенческий форум _ Теория вероятностей _ Идентификация законов распределения

Автор: Ната22 17.2.2009, 7:18

Как посчитать репрезентативную выборку???

Автор: tig81 17.2.2009, 18:37

Цитата(Ната22 @ 17.2.2009, 9:18)

Как посчитать репрезентативную выборку???

А что такое "репрезентативная выборка"?

Автор: Juliya 17.2.2009, 19:11

Мне более интересно, что значит "как её посчитать"

Автор: Ната22 18.2.2009, 12:38

Цитата(Juliya @ 17.2.2009, 19:11)

Мне более интересно, что значит "как её посчитать"

Это значит как нашли S(X) в таблице???? смотрите вложенный файл

Прикрепленные файлы

курсач.zip ( 62.72 килобайт ) Кол-во скачиваний: 46

Автор: Juliya 18.2.2009, 16:39

ну элементарно!

Вы (или не Вы судя по всему, а кто-то) нашли шаг, разбили всю область возможных значений случайной величины на интервалы и считаем, сколько значений исходных данных попало в каждый интервал.
Например, первый интервал - [1;6,89] - в него попадает, видимо (я не пересчитывала ) 87 значений, поэтому S(x)=87. Далее смотрите, сколько значений попало во 2-й интервал и т.д. Это и будут эмпирические частоты - т.е. сколько значений, полученных эмпирически, опытным путем, попало в каждый из интервалов.
Для удобства подсчета лучше всего исходные данные ранжировать - т.е. выстроить в порядке возрастания - тогда легко будет подсчитать, сколько значений попало в каждый интервал... Ну, или для продвинутых пользователей Excel есть специальная функция ЧАСТОТА, которая позволяет эти частоты быстро рассчитать.

Потом согласно проверяемому теоретическому закону распределения (здесь - экспоненциальный, но проверить можно на принадлежность любому закону распределения) рассчитываете теоретические частоты - т.е. сколько значений бы попало, если бы изучаемый показатель имел интересующий нас закон распределения с параметром, рассчитанным для Вашей выборки.
И затем эмпирические и теоретические частоты сравниваются - насколько они близки с помощью критерия согласия Пирсона.

ЗЫ и для сведения, репрезентативная выборка - это выборка, правильно отражающая пропорции генеральной совокупности. Это достигается случайностью отбора объектов из генеральной совокупности. У вас выборка уже дана - а даже неизвестно, да Вас никто это и не спрашивает, насколько она репрезентативна.

Автор: Ната22 19.2.2009, 5:23

Спасибо за ответ!

Но это для вас элементарно....а я так и не могу понять откуда получилось 87 и как..и что разбивают на интервалы...........(понятно что таблицу значений, пересчитала уже и так и так не могу получить 87)
что нужно складывать с чем???

Автор: Juliya 19.2.2009, 11:52

Берем Вашу исходную таблицу:
http://www.radikal.ru

и ранжируем, как я уже писала (выстраиваем по возрастанию). Далее просто считаем, сколько значений попало в каждый из интервалов:

http://www.radikal.ru

Теперь я уже проверила, все частоты посчитаны верно - но Вы и сами теперь можете в этом убедиться. Интервалы и соответствующие им значения я выделила одним цветом.

Т.е. смысл построения интервального ряда в том, чтобы сгруппировать все значения случайной величины и посмотреть, насколько плотно они распределены по числовой оси, чтобы можно было подобрать подходящий закон распределения. Согласитесь, по 200 исходным наблюдениям это сделать проблематично...

Кстати, замеченные при беглом просмотре ошибки:

Цитата

В результате получим 9 интервалов, длина интервала i = 21,44.

почему? шаг ведь у Вас получился 5,89, судя по границам интервалов.
А у меня при расчетах по той же формуле Стерджеса получилось 6,131405285

И ещё. Обычно при построении интервального ряда за нижнюю границу принимают не минимальное значение (как у Вас), а немного сдвигают влево - обычно на полшага (т.е. в данном случае по этой задаче нужно было начать первый интервал от нуля... но вряд ли время отклика будет меньше 1 сек, видимо, точность измерений не позволяет это сделать). Но это уже нюансы, делайте, как Вам давали... Может, у всех разные подходы...

Автор: Ната22 11.3.2009, 7:32

спасибо за подробное описание решения

И вот еще один вопрос из этого же задания

Критическая точка правосторонней критической области 2кр (0,05;7) = 14,07. Таким образом получаем, что 2набл < 2кр, следовательно гипотезу о распределении данной случайной величины по экспоненциальному закону можно принять с достаточно большой степенью вероятности.

наблюдаемое понятно от куда а критическое как нашли????

Автор: malkolm 11.3.2009, 20:34

Excel:
=ХИ2ОБР(0,05;7)

Автор: Ната22 12.3.2009, 12:03

ну было бы еще хорошо если бы точное решение описали...
а не этот интервал. откуда он взялся этот интервал??

Автор: malkolm 12.3.2009, 16:42

О каком интервале речь? Здесь ни одного интервала нет вроде бы.

Вы вообще про критерий хи-квадрат что-нибудь знаете? Граница критической области - это квантиль хи-квадрат распределения с числом степеней свободы, связанным с числом интервалов группировки (в данном случае 7 степеней свободы), а уровень этой квантили равен 1-0,05, потому что у Вас 0,05 берётся в качестве размера критерия.

Автор: Juliya 12.3.2009, 22:16

Цитата(Ната22 @ 11.3.2009, 10:32)

а критическое как нашли????

если не дружите с Excel, используйте таблицы хи-квадрат распределения (наверняка у вас есть в конце учебника)
и почитайте, что такое и как работает критерий согласия Пирсона для проверки гипотез о законе распределения! Все встанет сразу на свои места...

Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)