Всем доброго времени суток. Буду очень благодарна, если кто-нибудь ответит на вопрос или подскажет, где про это можно почитать.
Имеются 2 выборки. В одной 37 элементов, в другой - 30. Элементы - числа от 0,03 до 0,18, очень много повторений. Про распределение ничего не известно, точно не нормальное. Необходимо сделать так, чтобы объем выборок стал одинаковым. Добавить элементы во вторую выборку возможности нет, стало быть, нужно просто выкинуть 7 элементов из первой.
Собственно, вопрос: какие именно элементы из первой выборки следует выкинуть, чтобы распределение изменилось как можно меньше? Случайным образом? Или, может быть, максимально отличающиеся от среднего? (Этот вариант, ИМХО, вряд ли подходит, так как повторений очень много, и будут выброшены просто 7 самых больших чисел). Как вообще поступают в таких случаях?
Заранее спасибо.
"Обычно" избавляются от аномальных значений. Т.е. тех, что "максимально отличаются от среднего".
Большое спасибо!
Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)