У меня есть задача с квадратичной регрессией. Я нашел оценки a,b,c и сигмы. Теперь мне нужно построить интервальные оценки этих параметров.
Если я не ошибаюсь, то a лежит в пределах от оценки а - квантиль*sigma/N-3(кол-во параметров) до того же, только с плюсом. Правдива ли эта формула?
Не совсем так. В роли сигма должно выступать с.к.о. оценки для нужного параметра. Через сигма оно выражается с помощью множителя как http://www.machinelearning.ru/wiki/index.php?title=%D0%94%D0%BE%D0%B2%D0%B5%D1%80%D0%B8%D1%82%D0%B5%D0%BB%D1%8C%D0%BD%D1%8B%D0%B5_%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%B2%D0%B0%D0%BB%D1%8B_%D0%B4%D0%BB%D1%8F_%D0%BF%D0%B0%D1%80%D0%B0%D0%BC%D0%B5%D1%82%D1%80%D0%BE%D0%B2_%D1%80%D0%B5%D0%B3%D1%80%D0%B5%D1%81%D1%81%D0%B8%D0%B8. Матрица X там - это матрица плана, первый столбец - единицы, второй - иксы, третий - квадраты иксов. Индекс _jj означает jj-й диагональный элемент.
А какой j то брать, пардон за глупый вопрос?
Чуть подкреплю.
Вот я нашел оценки a,b,c и сигмы.
Вот матрица:
Для оценки a я должен взять корень из 0,074 и домножить на квантиль.
Для б: 26,65
А для сигмы что делать?)
Ну если a - это у Вас свободный член, то первый. Если а - коэффициент при x^2, то третий.
Не просто на квантиль, ещё на оценку для сигма. Кстати, там всюду в роли оценки для сигма квадрат используется несмещенная оценка, т.е. сумма квадратов оцененных остатков регрессии, делённая на n-k.
Для сигма - так там пунктом ниже доверительный интервал (с помощью хи-квадрат-распределения) для сигма квадрат. RSS - residual sum of squares - это как раз сумма квадратов оцененных остатков регрессии, т.е. сигма квадрат, умноженное на n-k, т.е. на n-3.
Ну какой-то большой разброс для того же a выходит, это нормально?
Ну, не такой большой, если сигма порядка трёх, корень из 0,074 - тоже немного, квантиль - порядка двух-трёх. При такой дисперсии он маленьким и не может быть.
Русская версия Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)