Тема 7. Многофакторная линейная регрессия

Тема 7. Многофакторная линейная регрессия

В многофакторных моделях действенный признак находится в зависимости от нескольких причин. Множественный либо многофакторный корреляционно-регрессионный анализ решает три задачки: определяет форму связи действенного признака с факторными, выявляет тесноту этой связи и устанавливает воздействие отдельных причин. Для двухфакторной линейной регрессии эта модель имеет вид:

(2.15)

Характеристики модели ao, a1, a2 находятся методом решения Тема 7. Многофакторная линейная регрессия системы обычных уравнений:

(2.16)

Покажем особенности эконометрического многофакторного анализа на рассмотренном выше примере, но введем дополнительный фактор – размер семьи. В таблице 6 представлены статистические данные о расходах на питание, душевом доходе и размере семьи для 9 групп семей. Требуется проанализировать зависимость величины расходов на питание от величины душевого дохода и Тема 7. Многофакторная линейная регрессия размера семьи.

Таблица 6

Номер группы Расход на питание (у) Душевой доход (х) Размер семей (чел)
1,5
2.1
2.7
3.2
3.4
3.6
3,7
4,0
3.7

Разглядим двухфакторную линейную модель зависимости расходов на питание (у) от величины душевого дохода семей (x1) и размера семей (x2). Результаты расчетов с внедрением электрических таблиц EXCEL представлены в таблице 7.

Таблица 7

ВЫВОД ИТОГОВ
Регрессионная статистика Тема 7. Многофакторная линейная регрессия
Множественный R 0,997558
R-квадрат 0,995121
Нормированный R-квадрат 0,993495
Стандартная ошибка 50,84286
Наблюдения
df SS MS F Значимость F
Регрессия 611,9239 1,1612E-07
Остаток 15509,98 2584,996
Итого
Коэффициенты Стандартная ошибка t-статистика P-Значение Нижние 95%
Y-пересечение -187,141 77,17245 -2,42498 0,051513 -375,97561
Переменная X 1 0,071995 0,004463 16,13289 3,61E-06 0,06107576
Переменная X 2 343,0222 29,40592 11,66507 2,39E-05 271,068413

Эконометрическая модель имеет последующий вид

Высочайшие значения коэффициента детерминации R2 = 0,995 и значение F – аспекта совершенно Тема 7. Многофакторная линейная регрессия точно гласит об адекватности приобретенной модели начальным данным. Стоит отметить, что эти значения намного превосходят значения R2 и F – аспекта, которые были получены в модели с одним фактором. Таким макаром, введение в модель еще 1-го фактора улучшает качество модели в целом.

В какой степени допустимо использовать аспект R Тема 7. Многофакторная линейная регрессия2 для выбора меж несколькими регрессионными уравнениями? Дело в том, что при добавлении еще одного фактора R2 всегда увеличивается и, если взять число причин, равным числу наблюдений, то можно достигнуть того, что R2 = 1. Но это совсем не будет означать, что приобретенная эконометрическая модель будет иметь экономический смысл.

Попыткой убрать эффект, связанный Тема 7. Многофакторная линейная регрессия с ростом R2 при возрастании числа причин, является корректировка значения R2 с учетом применяемых причин в нашей модели.

Скорректированный (adjusted) R2 имеет последующий вид:

(2.17)

где n – объем подборки;

k – количество коэффициентов в уравнении регрессии.

Для нашего варианта

В определенной степени внедрение скорректированного коэффициента детерминации R2 более корректно для Тема 7. Многофакторная линейная регрессия сопоставления регрессий при изменении количества причин.

В этом случае, когда имеются одна независящая и одна зависимая переменные, естественной мерой зависимости является (выборочный) коэффициент корреляции меж ними. Внедрение множественной регрессии позволяет обобщить это понятие на случай, когда есть некоторое количество независящих переменных. Корректировка тут нужна по последующим естественным суждениям. Высочайшее значение Тема 7. Многофакторная линейная регрессия коэффициента корреляции меж исследуемой зависимой и какой-нибудь независящей переменной может, по-прежнему, означать высшую степень зависимости, но может быть обосновано и другой предпосылкой. К примеру, может существовать 3-я переменная, которая оказывает сильное воздействие на две 1-ые, что и является, в конечном счете, предпосылкой их высочайшей коррелированности. Потому Тема 7. Многофакторная линейная регрессия появляется естественная задачка отыскать «чистую» корреляцию меж 2-мя переменными, исключив (линейное) воздействие других причин. Это можно сделать при помощи коэффициента личной корреляции:

(2.18)

где

(2.19)

(2.20)

(2.21)

Значения рассчитываются как

Значения коэффициента личной корреляции лежат в интервале [-1,1], как у обыденного коэффициента корреляции. Равенство этого коэффициента нулю значит, говоря нестрого, отсутствие прямого (линейного) воздействия переменной X1 на У.

Существует Тема 7. Многофакторная линейная регрессия тесноватая связь меж коэффициентом личной корреляции и коэффициентом детерминации, а конкретно

(2.22)

либо

Воздействие отдельных причин в многофакторных моделях может быть охарактеризовано при помощи личных коэффициентов эластичности, которые в случае линейной двухфакторной модели рассчитываются по формулам:

Черта над эмблемой, как и ранее, значит среднюю арифметическую. Личные коэффициенты эластичности демонстрируют, как процентов поменяется Тема 7. Многофакторная линейная регрессия действенный признак, если значение 1-го из факторных признаков поменяется на 1%, а значение другого факторного признака останется прежним.

Для определения области вероятных значений действенного показателя при узнаваемых значениях причин, т.е. доверительного интервала прогноза, нужно учесть два вероятных источника ошибок. Ошибки первого рода вызываются рассеиванием наблюдений относительно полосы регрессии Тема 7. Многофакторная линейная регрессия, и их можно учитывать, а именно, величиной среднеквадратической ошибки аппроксимации изучаемого показателя при помощи регрессионной модели (Sy)

(2.23)

Ошибки второго рода обоснованы тем, что в реальности агрессивно данные в модели коэффициенты регрессии являются случайными величинами, распределенными по нормальному закону. Эти ошибки учитываются вводом поправочного коэффициента при расчете ширины доверительного Тема 7. Многофакторная линейная регрессия интервала; формула для его расчета включает табличное значение t-статистики при данном уровне значимости и находится в зависимости от вида регрессионной модели. Для линейной однофакторной модели величина отличия от полосы регрессии задается выражением (обозначим его R):

, (2.24)

где п – число наблюдений,

L – количество шагов вперед,

а – уровень значимости прогноза,

X – наблюдаемое Тема 7. Многофакторная линейная регрессия значение факторного признака в момент t,

– среднее значение наблюдаемого фактора,

– прогнозное значение фактора на L шагов вперед.

Таким макаром, для рассматриваемой модели формула расчета нижней и верхней границ доверительного интервала прогноза имеет вид:

(2.25)

где UL значит точечную прогнозную оценку изучаемого действенного показателя по модели на L шагов вперед.


tema-7-korrelyaciya-vichislenie-koefficientov-korrelyacii-2-chasa.html
tema-7-kultura-vostochnih-civilizacij-drevnij-egipet.html
tema-7-lichnostnie-faktori-uspeshnosti-v-biznese-uchebno-metodicheskij-kompleks-disciplini-psihologiya-biznesa-dlya.html