Версия для печати темы

Нажмите сюда для просмотра этой темы в обычном формате

Образовательный студенческий форум _ Теория вероятностей _ Как уменьшить объем выборки?

Автор: Mareika 25.12.2012, 14:34

Всем доброго времени суток. Буду очень благодарна, если кто-нибудь ответит на вопрос или подскажет, где про это можно почитать.

Имеются 2 выборки. В одной 37 элементов, в другой - 30. Элементы - числа от 0,03 до 0,18, очень много повторений. Про распределение ничего не известно, точно не нормальное. Необходимо сделать так, чтобы объем выборок стал одинаковым. Добавить элементы во вторую выборку возможности нет, стало быть, нужно просто выкинуть 7 элементов из первой.

Собственно, вопрос: какие именно элементы из первой выборки следует выкинуть, чтобы распределение изменилось как можно меньше? Случайным образом? Или, может быть, максимально отличающиеся от среднего? (Этот вариант, ИМХО, вряд ли подходит, так как повторений очень много, и будут выброшены просто 7 самых больших чисел). Как вообще поступают в таких случаях?

Заранее спасибо.

Автор: Руководитель проекта 25.12.2012, 16:36

"Обычно" избавляются от аномальных значений. Т.е. тех, что "максимально отличаются от среднего".

Автор: Mareika 25.12.2012, 17:13

Большое спасибо!

Автор: Руководитель проекта 25.12.2012, 17:21

Цитата(Mareika @ 25.12.2012, 21:13) *

Большое спасибо!

Пожалуйста. Но всегда нужно исходить из сущности задачи.

Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)