2. Рассчитываем матрицу
Используя пакет STADIA (меню преобразований), получаем:
=
Оценку ковариационной матрицы получим путем умножения матрицы на множитель
Обозначим оценку ковариационной матрицы S, используя пакет MathCad находим:
оценка ковариационной матрицы.
Для расчета ковариационной матрицы воспользуемся формулой (1) и определением ковариационной матрицы (2), получаем следующую оценку корреляционной матрицы:
Данный расчет можно провести на прямую, используя пакет STADIA, но наша цель бала показать весь процесс расчета корреляционной матрицы. Проанализируем корреляционную матрицу.
1 – я строка и 1 – столбец это признак у , как видим наибольшая связь наблюдается между признаками х7 и х14 очень тесная (-0,938) , если анализировать парную связь между факторными признаками, то можно заметить наибольшую связь между признаком х5 и х17 (-0,938).
Устранение мультиколлинеарности с помощью метода пошаговой регрессии
Устраним мультиколлинеарность методом пошаговой регрессии,
который предполагает, что на каждом шаге мы будем включать в уравнение регрессии тот признак, который будет вызывать наибольшее приращение коэффициента детерминации.
Шаг 1
Строим уравнения регрессии
Находим максимальный коэффициент детерминации (где k=1)
Вычисляем нижнюю границу коэффициента детерминации достигнет своего максимума.
Используя пакет STADIA определяем:
Переменная
k
X17
0.191
0.7117
1
Шаг 2
Строим уравнения регрессии
Находим максимальный коэффициент детерминации (где k=1)
Вычисляем нижнюю границу коэффициента детерминации достигнет своего максимума.
Используя пакет STADIA определяем:
Переменная
k
X7
0.7618
0.7117
1
Х7,Х9
0.8118
0.750
2
Шаг 3
Строим уравнения регрессии
Находим максимальный коэффициент детерминации (где k=1)
Вычисляем нижнюю границу коэффициента детерминации достигнет своего максимума.
Используя пакет STADIA определяем:
Переменная
k
X7
0.7618
0.7117
1
Х7,Х9
0.8118
0.750
2
Х7,Х9,X3
0.80953
0.735
3
Процесс прекращаем поскольку, меньше таких коэффициентов для уравнений регрессии с двумя переменными.
Подробный анализ, выполненный с помощью программы “Stadia”, приведен в Приложении 1.
Граф.1
Подробные расчеты см. Приложение 1
Таким образом , из анализа исключаются все факторные признаки,
кроме Х7,X9
2. Проверить построенную модель на гетероскедастичность. Построить обобщенную модель множественной регрессии (случай гетероскедастичности остатков)
1.4 Построение и исследование новой модели регрессии.
1.4.1 Вычисление оценок коэффициентов регрессии
Регрессионная модель примет вид:
Вывод т.к. около 1, то можно считать , что связь тесная.
Проверка значимости и построение доверительных интервалов для коэффициентов регрессии
Проверим значимость уравнения регрессии:
H0:<регрессионная модель незначима>
H1:<регрессионная модель значима>
Fвычисленное=57.1
Fкритическое (0,05;2;24)=3,40 так как Fвычисленное > Fкритическое ,
то принимается гипотеза Н1 , следовательно в уравнении коэффициенты регрессии должны быть значимыми.
Проверим значимость коэффициентов регрессии
tкритическое =2.064
tвычисленное = .
коэффициент значим.
коэффициент значим
.
коэффициенты значимы, поскольку> tкритическое =2.064, < tкритическое ,
Построим доверительный интервал для коэффициентов по формуле:
где остаточная дисперсия
Используя пакет STADIA находим доверительный интервал для коэффициента при переменной Х7,Х9.
1.4.2 Построение доверительного интервала для результативного признака
Доверительный интервал для результативного признака будем строить , исходя из формулы:
,
где t-значение статистики Стьюдента при и
степенях свободы.
Построим доверительный интервал прогноза в точке , используя пакет STADIA ,находим:
2. Исследование модели на наличие гетероскедастичности
Критерий ранговой корреляции Спирмена. По выборочным данным строим регрессионную модель, которую оцениваем с помощью МНК. Вычисляем регрессионные остатки: еi=уi-ýi. Данные объясняющих переменных и остатки ранжируют, после чего исследуют зависимость между хi и εi. Для этого выдвигаем гипотезу Нo: нет зависимости между объясняющей переменной и регрессионными остатками ( она равносильна гипотезе о том, что нет явления гетероскедастичности), Нı: есть зависимость, т.е. явление гетероскедастичности наблюдается. Для проверки гипотезы строится статистика, распределенная нормально с математическим ожиданием равным нулю и дисперсией равной 1: t=Rх.е ,
где Rx,e=1-6* -коэффициент ранговой корреляции Спирмена, где Di2= rang xi- rang ei .
На заданном уровне значимости α=0.05 по таблице нормального распределения находим tкр
Если tн>t, то нулевую гипотезу отвергаем, значит есть явления гетероскеластичности, в противном случае явление гетероскедастичности наблюдаем. В случае наличия гетероскедастичности, используя ОМНК оценим
регрессию, взяв в качестве матрицы Ω=
Проверим наличие гетероскедастичности по переменной Х7
rang xi
rang ei
Di
Di2
21.3
69.2
77.9
17.1
18.4
37.9
72.2
27.5
58.2
46.2
74
43.5
18.8
59.5
52.2
65.1
60.2
2.63
84
19.8
78.7
62
104
69.3
78.9
15.1
51.5
84.98
30.58
38.42
60.34
60.22
60.79
29.82
70.57
34.51
64.73
36.63
32.84
62.64
34.07
39.27
28.46
30.27
69.04
25.42
53.13
28.00
38.79
32.04
38.58
18.51
57.62
20.80
-0.917
2.18
0.808
-5
-7.52
-17.5
7.55
-10.2
11.5
-21.7
2.23
0.909
-7.49
19.7
4.75
-10.3
11.9
10.8
-4.14
-8.63
-6.32
-13.4
-3.89
-5.4
-1.42
19.6
32
2,5
19,5
24
4,5
2,5
8,5
18
8,5
14
11
21
10
7
12,5
12,5
16
19,5
4,5
26
6
22
16
27
23
25
1
16
15
18
16
11
7
2
21
5
23
1
19
17
8
26
20
4
24
22
12
6
9
3
13
10
14
25
27
-15
-18
8
-11
-7
-2
-3
-5
-9
10
2
-7
-1
-26
-20
12
-24
-22
14
0
13
13
14
13
11
-24
-11
225
324
64
121
49
4
9