Помощь - Поиск - Пользователи - Календарь
Полная версия: Формула Стерджеса > Теория вероятностей
Образовательный студенческий форум > Высшая математика > Теория вероятностей
Juliya
Наткнулась тут на обсуждение формулы Стерджеса и не могу точно перевести термин: oversmoothed histograms. Почему-то поисковики ничего не дают.. Никто не знает, что это? Переполненные? Со слишком большим числом интервалов?
или чересчур сглаженные ? а это как?
или как точно?

Цитата
Most statistical packages use Sturges’ rule (or an extension of it) for selecting the number of classes when constructing a histogram. Sturges’ rule is also widely recommended in introductory statistics textbooks. It is known that Sturges’ rule leads to oversmoothed histograms, but Sturges’ derivation of his rule has never been questioned. In this note, I point out that the argument leading to Sturges’ rule is wrong.
Juliya
Цитата
It is well known that major strength of non-parametric regression function estimation breaks down when correlated errors exist in the data. Positively (negatively) correlated errors tend to produce undersmoothing (oversmoothing).

вот нашла ещё похожий термин в рамках непараметрических регрессионных моделей...
Положительно (отрицательно) скоррелированные ошибки как раз производят undersmoothing (oversmoothing). У нас, если не ошибаюсь, это просто называется положительная или отрицательная автокорреляция ошибок...

видимо, это не связано с гистограммой, которые, оказывается, тоже могут быть undersmoothed и oversmoothed...
malkolm
"Слишком сглаженные". Существует ли устоявшийся русскоязычный термин для этого понятия в практической статистике, не ведаю.

Грубо говоря, это гистограммы либо ядерные оценки плотности с слишком большим "окном", т.е. с малым числом интервалов группировки. Недостаточное число интервалов не позволяет заметить резкие колебания и прочие особенности плотности, т.е. как бы излишне сглаживает особенности плотности.
Juliya
thumbsup.gif Спасибо огромное! flowers1.gif

Понятно.... а undersmoothed - я сама видела, с "дырками", с отсутствием значений в некоторых интервалах, т.е. наоборот, разбитые на слишком большое количество интервалов.

Вот нашла хорошую статью про количество интервалов при построении гистограммы...

а какую формулу Вы считаете наилучшей?
malkolm
Я не имею дела с практической статистикой ни разу smile.gif Если же говорить о скорости сходимости ядерных оценок к плотности, то скорость эта, деваться некуда, сильно зависит от гладкости самой плотности. В зависимости от степени её гладкости оптимальный шаг h_n в оценке
f_n(x) = 1/(n*h_n) *sum_i q((x-x_i) / h_n) может быть и порядка корня кубического из 1/n, и корня 5-й степени и т.п.
Juliya
Я так поняла, формула Стерджеса хорошо работает при небольших выборках (n~50-200), при обработке современных огромных массивов типа n~10^6 уже не годится..

а что такое ядерные оценки? Никогда не сталкивалась с этим термином... blush.gif
malkolm
Ядерная оценка (kernel estimate), она же оценка Розенблата - Парзена - способ непараметрического оценивания плотности функцией, нарисованной выше. Там x1,...,xn - выборка, а ядро q(x) - некая чётная (желательно, ограниченная) функция, нормированная как плотность, с единичным "вторым моментом" int x^2 q(x) dx = 1. Например, кривая Гаусса.
Juliya
Спасибо! smile.gif
Неведомский
oversmoothed -- пересглаженный.

http://www.nsu.ru/ef/tsy/ecmr/glossary/glossary.htm
Juliya
Спасибо большое! smile.gif

Ну, мы что-то такое и напереводили.. А словарик отличный, ещё раз спасибо...

Эх, люблю я Сибирь что-то все больше и больше... bigwink.gif скоро, чувствую, главным научным центром страны будет...
malkolm
Мне бы Ваш оптимизм sad.gif Широко известная лет 30-40 назад в моей специальности Н-ская научная школа, например, исчезла полностью. Всего-то и остались - один престарелый академик, три доктора, ничего выдающегося не демонстрирующих, да пяток кандидатов, из которых звёзды тоже не вырастут...
Dimka
Цитата(Juliya @ 18.1.2010, 19:26) *


скоро, чувствую, главным научным центром страны будет...


она и раньше им была, только до ума ничего толком не доводили.
Это текстовая версия — только основной контент. Для просмотра полной версии этой страницы, пожалуйста, нажмите сюда.
Русская версия Invision Power Board © 2001-2024 Invision Power Services, Inc.