Как посчитать репрезентативную выборку???
Мне более интересно, что значит "как её посчитать"
ну элементарно!
Вы (или не Вы судя по всему, а кто-то) нашли шаг, разбили всю область возможных значений случайной величины на интервалы и считаем, сколько значений исходных данных попало в каждый интервал.
Например, первый интервал - [1;6,89] - в него попадает, видимо (я не пересчитывала ) 87 значений, поэтому S(x)=87. Далее смотрите, сколько значений попало во 2-й интервал и т.д. Это и будут эмпирические частоты - т.е. сколько значений, полученных эмпирически, опытным путем, попало в каждый из интервалов.
Для удобства подсчета лучше всего исходные данные ранжировать - т.е. выстроить в порядке возрастания - тогда легко будет подсчитать, сколько значений попало в каждый интервал... Ну, или для продвинутых пользователей Excel есть специальная функция ЧАСТОТА, которая позволяет эти частоты быстро рассчитать.
Потом согласно проверяемому теоретическому закону распределения (здесь - экспоненциальный, но проверить можно на принадлежность любому закону распределения) рассчитываете теоретические частоты - т.е. сколько значений бы попало, если бы изучаемый показатель имел интересующий нас закон распределения с параметром, рассчитанным для Вашей выборки.
И затем эмпирические и теоретические частоты сравниваются - насколько они близки с помощью критерия согласия Пирсона.
ЗЫ и для сведения, репрезентативная выборка - это выборка, правильно отражающая пропорции генеральной совокупности. Это достигается случайностью отбора объектов из генеральной совокупности. У вас выборка уже дана - а даже неизвестно, да Вас никто это и не спрашивает, насколько она репрезентативна.
Спасибо за ответ!
Но это для вас элементарно....а я так и не могу понять откуда получилось 87 и как..и что разбивают на интервалы...........(понятно что таблицу значений, пересчитала уже и так и так не могу получить 87)
что нужно складывать с чем???
Берем Вашу исходную таблицу:
http://www.radikal.ru
и ранжируем, как я уже писала (выстраиваем по возрастанию). Далее просто считаем, сколько значений попало в каждый из интервалов:
http://www.radikal.ru
Теперь я уже проверила, все частоты посчитаны верно - но Вы и сами теперь можете в этом убедиться. Интервалы и соответствующие им значения я выделила одним цветом.
Т.е. смысл построения интервального ряда в том, чтобы сгруппировать все значения случайной величины и посмотреть, насколько плотно они распределены по числовой оси, чтобы можно было подобрать подходящий закон распределения. Согласитесь, по 200 исходным наблюдениям это сделать проблематично...
Кстати, замеченные при беглом просмотре ошибки:
спасибо за подробное описание решения
И вот еще один вопрос из этого же задания
Критическая точка правосторонней критической области 2кр (0,05;7) = 14,07. Таким образом получаем, что 2набл < 2кр, следовательно гипотезу о распределении данной случайной величины по экспоненциальному закону можно принять с достаточно большой степенью вероятности.
наблюдаемое понятно от куда а критическое как нашли????
Excel:
=ХИ2ОБР(0,05;7)
ну было бы еще хорошо если бы точное решение описали...
а не этот интервал. откуда он взялся этот интервал??
О каком интервале речь? Здесь ни одного интервала нет вроде бы.
Вы вообще про критерий хи-квадрат что-нибудь знаете? Граница критической области - это квантиль хи-квадрат распределения с числом степеней свободы, связанным с числом интервалов группировки (в данном случае 7 степеней свободы), а уровень этой квантили равен 1-0,05, потому что у Вас 0,05 берётся в качестве размера критерия.
Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)