Наткнулась тут на http://www.robjhyndman.com/papers/sturges.pdf и не могу точно перевести термин: oversmoothed histograms. Почему-то поисковики ничего не дают.. Никто не знает, что это? Переполненные? Со слишком большим числом интервалов?
или чересчур сглаженные ? а это как?
или как точно?
"Слишком сглаженные". Существует ли устоявшийся русскоязычный термин для этого понятия в практической статистике, не ведаю.
Грубо говоря, это гистограммы либо ядерные оценки плотности с слишком большим "окном", т.е. с малым числом интервалов группировки. Недостаточное число интервалов не позволяет заметить резкие колебания и прочие особенности плотности, т.е. как бы излишне сглаживает особенности плотности.
Спасибо огромное!
Понятно.... а undersmoothed - я сама видела, с "дырками", с отсутствием значений в некоторых интервалах, т.е. наоборот, разбитые на слишком большое количество интервалов.
Вот нашла хорошую http://www3.interscience.wiley.com/cgi-bin/fulltext/123227717/HTMLSTARTпро количество интервалов при построении гистограммы...
а какую формулу Вы считаете наилучшей?
Я не имею дела с практической статистикой ни разу Если же говорить о скорости сходимости ядерных оценок к плотности, то скорость эта, деваться некуда, сильно зависит от гладкости самой плотности. В зависимости от степени её гладкости оптимальный шаг h_n в оценке
f_n(x) = 1/(n*h_n) *sum_i q((x-x_i) / h_n) может быть и порядка корня кубического из 1/n, и корня 5-й степени и т.п.
Я так поняла, формула Стерджеса хорошо работает при небольших выборках (n~50-200), при обработке современных огромных массивов типа n~10^6 уже не годится..
а что такое ядерные оценки? Никогда не сталкивалась с этим термином...
Ядерная оценка (kernel estimate), она же оценка Розенблата - Парзена - способ непараметрического оценивания плотности функцией, нарисованной выше. Там x1,...,xn - выборка, а ядро q(x) - некая чётная (желательно, ограниченная) функция, нормированная как плотность, с единичным "вторым моментом" int x^2 q(x) dx = 1. Например, кривая Гаусса.
Спасибо!
oversmoothed -- пересглаженный.
http://www.nsu.ru/ef/tsy/ecmr/glossary/glossary.htm
Спасибо большое!
Ну, мы что-то такое и напереводили.. А словарик отличный, ещё раз спасибо...
Эх, люблю я Сибирь что-то все больше и больше... скоро, чувствую, главным научным центром страны будет...
Мне бы Ваш оптимизм Широко известная лет 30-40 назад в моей специальности Н-ская научная школа, например, исчезла полностью. Всего-то и остались - один престарелый академик, три доктора, ничего выдающегося не демонстрирующих, да пяток кандидатов, из которых звёзды тоже не вырастут...
Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)