R²= ∑(y-y)²
Коэффициент детерминации- квадрат коэффициента или индекса корреляции.
F-mecm-оценивание качества уровнения регрессии- состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического
Fфакт и критического (табличного) Fтабл значений F критерия Фишера. Fфакт-
определяется из соотношения значений факторной и остаточной дисперсией, рассчитанных на одну степень свободы:
∑(ỹx-y)²/m r²xy
Fфакт= = (n-2)
∑(y-ỹ)² /(n-m-1) 1-r²xy
n- число едениц совокупности;
m- число параметров при переменных х.
Fтабл- это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а
Уровень значимости а вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл< Fфакт то Но – гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл> Fфакт , то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
УСЛОВИЕ
По пяти городам известны значения 2х признаков: табл.№1
город |
Средний доход сельхоз-хозяйств в % |
Средний прирост КРС |
Красноярск |
72,8 |
47,1 |
Брянск |
63,2 |
59,2 |
Армавир |
61,9 |
50,2 |
Ростов |
58,7 |
63,8 |
Киев |
57,0 |
60,8 |
Требуется:
1) для характеристики зависимости у от х рассчитать параметры следующих функций (линейной, степенной, показательной, равносторонней гиперболы).
2) оценить каждую модель через среднюю ошибку аппроксимации А и F- критерии Фишера.
ЛИНЕЙНАЯ РЕГРЕССИВНАЯ МОДЕЛЬ
Для расчета параметров а и b линейной регрессии у=а+b∙x ,решаем систему нормальных уравнений относительно а и b:
n∙a+b∙∑x=∑y
yx- y∙x
a∙∑x+b∙∑x²=∑y∙x получаем b= σ²x
табл.№2
№п/п |
у |
х |
ух |
x² |
y² |
ŷx |
у – ŷx |
Аi |
1 |
72,8 |
47,1 |
3428,88 |
2218,41 |
5299,84 |
68,87 |
3,93 |
5,30 |
2 |
63,2 |
59,2 |
3741,44 |
3504,64 |
3994,24 |
60,64 |
2,56 |
4,04 |
3 |
61,9 |
50,2 |
3107,38 |
2520,04 |
3831,61 |
66,76 |
-4,9 |
7,80 |
4 |
58,7 |
63,8 |
3745,06 |
4070,44 |
3445,69 |
57,51 |
1,13 |
1,90 |
5 |
57,0 |
60,8 |
3465,6 |
3696,64 |
3249 |
59,55 |
-2,55 |
4,47 |
Итого |
313,6 |
281,1 |
17488,36 |
16010,17 |
19820,38 |
|
|
23,51 |
Среднее значение |
62,72 |
56,22 |
3497,672 |
3202,034 |
3964,076 |
|
|
4,7 |
σ |
5,5025 |
6,43 |
|
|
|
|
|
|
σ² |
30,2776 |
41,34 |
|
|
|
|
|
|
Дисперсия получается, по формуле
1
σy²= n ∑(yi-y)²
σy²=3964.076-62.72²=30.2776
σх²=3202.034-56.22²=41.3456
ух-у∙х
b= σ²x =(3497,672-62,72∙56,22)/41,3456=0,68
а= у-b∙x=62,72+0,68∙56,22=100,9
уравнение регрессии ŷ=100,9-0,68х
ŷ1=100,9-0,68∙47,1=68,87
ŷ2=100,9-0,68∙59,2=60,64
ŷ3=100,9-0,68*50,2=66,76
ŷ4=100,9-0,68*63,8=57,51
ŷ5=100,9-0,68*60,8=59,55
Считаем линейный коэффициент парной корреляции
rху=b∙σx ∕ σy=0,68*6,43/5,5025=0,79 следовательно, связь сильная прямая
rху²=0.79²=0.62- коэффициент детерминации
Вариация результата на 62% объясняется вариацией фактора х. Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения ŷx и занесем их в таблицу. Найдем величину средней ошибки аппроксимации:
|yi-ŷxi|
Аi= yi *100%
А1=3,93/72,8*100%=5,3%
А2=2,56/63,2*100%=4,04%
А3=|-4,9| / 61,9*100%=7,8%
А4=1,13/58,7*100%=1,9%
А5=|-2,55| /57,0*100%=4,47%
В среднем расчетные значения отклоняются от фактических на 4,7%
По каждому наблюдению вычислим величину отклонения. Полученные данные занесем в таблицу
У1-ŷ1=72,8-68,87=3,93
У2-ŷ2=63,2-60,64=2,56
У3-ŷ3=61,9-66,76=-4,9
У4-ŷ4=58,7-57,57=1,13
У5-ŷ5=57,0-59,55=-2,55
Рассчитываем F критерий
∑(ỹx-y)²/m r²xy
Fфакт= = =0,62/(1-0,62)*(5-2)=4,89
∑(y-ỹ)² /(n-m-1) 1-r²xy (n-2)
т.к Fтабл.α=0,05 =10,13 следовательно Fтабл> Fфакт отсюда следует, что гипотеза Но принимается. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
ПОСТРОЕНИЕ СТЕПЕННОЙ РЕГРЕССИВНОЙ МОДЕЛИ
У=а*х предшествует процедура линеаризации переменных. Линеаризация производится путем логарифмирования обеих частей уравнения:
Lg y=lg a+b* lg x;
Y=C+b*X где
Y=lg y.,C= lg a., X= lg x
Табл.№3
№ п/п |
Y |
X |
YX |
Y² |
X² |
ŷx |
yi-ŷx |
(yi-ŷx)² |
Ai |
1 |
1,86 |
1,67 |
3,1062 |
3,4596 |
2,7889 |
68,61 |
4,19 |
17,6 |
5,76 |
2 |
1,80 |
1,77 |
3,186 |
3,24 |
3,1329 |
60,24 |
2,96 |
8,76 |
4,68 |
3 |
1,79 |
1,70 |
3,043 |
3,2041 |
2,89 |
66,17 |
-4,27 |
18,23 |
6,90 |
4 |
1,77 |
1,80 |
3,186 |
3,1329 |
3,24 |
57,72 |
0,98 |
0,96 |
1,67 |
5 |
1,76 |
1,78 |
3,1328 |
3,0976 |
3,1684 |
59,33 |
-2,33 |
5,43 |
4,09 |
Итого |
8,98 |
8,72 |
15,654 |
16,134 |
15,22 |
|
|
50,98 |
23,1 |
Сред.знач |
1,796 |
1,744 |
3,1308 |
3,22 |
3,044 |
|
|
10,196 |
4,62 |
σ |
0,3010 |
0,05 |
|
|
|
|
|
|
|
σ² |
0,0906 |
0,0025 |
|
|
|
|
|
|
|