Страница 9

. = . + . + .
= = = =
n
1 i
i , 2 i
n
1 i

i , 2 2 i , 2
n
1 i
i , 1 1
n
1 i
i , 2 0 x y x a x x a x a .
Обычно данную систему уравнений решают, используя методы линейной алгебры:
метод последовательных приближений (метод Зейделя), либо метод последовательного
исключения (метод Гаусса). Множественную степенную функцию приводят к линейной
форме путем логарифмирования и замены переменных таким же образом, как и парную
степенную функцию.
При использовании гибридных моделей параметры множественной регрессии нахо-
дятся с использованием численных процедур метода последовательных приближений.
Чтобы сделать окончательный выбор из нескольких корреляционных уравнений, не-
обходимо проверить каждое уравнение на тесноту связи, которая измеряется коэффици-
ентом корреляции, дисперсией и коэффициентом вариации. Для оценки можно использо-
вать также критерии Стьюдента и Фишера. Чем большую тесноту связи обнаруживает
кривая, тем она более предпочтительна при прочих равных условиях.
Дисперсия выровненных с помощью корреляционного уравнения значений показате-
ля yB относительно его фактических значений y определяется по формуле:
1 n
) y y ( n
1 i

i i , B

-
. -
= = . .
Дисперсия измеряет степень рассеяния данных относительно линии регрессии. При
строгой функциональной связи она равна нулю. Дисперсия имеет самостоятельное зна-
чение. Она показывает точность предсказания показателя с помощью построенной кор-
реляционной модели.
Теснота связи между показателем и параметром(ами) оценивается коэффициентом
корреляции, который показывает, какая часть общей колеблемости показателя приходит-
ся на влияние аргумента(ов).
При линейной парной корреляции коэффициент корреляции между x и y рассчиты-
вают по формуле:

..
.
..
.
.. .
.. .
. . - ..
.
..
.
.. .
.. .
. . -
. . . -
=
= = = =
= = =
2 n
1 i
i
n
1 i

i
2 n
1 i
i
n
1 i

i
n
1 i
n
1 i
n
1 i
i i i i
xy
x x n y y n
y x y x n
r .
Для того чтобы определить тесноту связи при множественной корреляции, необхо-
димо сначала рассчитать коэффициенты парной корреляции между показателем и каж-
дым параметром, а также между самими параметрами. Мерой тесноты связи служит в
этом случае коэффициент множественной корреляции R, квадрат которого при линейной
форме связи равен отношению двух определителей, состоящих из коэффициентов пар-
ной корреляции. Например, коэффициент множественной корреляции для функции с
двумя параметрами определяют следующим образом:
1 r
r 1
1 r r
r 1 r
r r 1
R

y 2 y 1
y 2 12
y 1 12

y 12 = .
После расчета определителей и упрощений получаем:

12 y 2 y 1

y 2

y 1
y 12 r 1
r r r 2 r r
R
-
- -
= .
Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее и оп-
ределеннее связь, описываемая уравнением регрессии. По самой примерной оценке кор-
реляционную связь можно считать установленной, если коэффициент корреляции по аб-
солютной величине не менее 0,5.
Если корреляционное уравнение находят по ограниченной выборке объектов (n
30), а это распространенный случай, то рассчитанный выше коэффициент корреляции
надо скорректировать следующим образом [40]:
1 k n
1 n ) R 1 ( 1 R 2
кор - -
-
- - = ,
где R и Rкор - ранее рассчитанный и скорректированный коэффициент парной или
множественной корреляции соответственно; k - число параметров в уравнении регрес-
сии.
Причем, если под знаком корня окажется отрицательное число, то в качестве уточ-
ненного значения скорректированного коэффициента корреляции следует брать ноль
[40].

Если решается задача такого класса, когда надо установить зависимость стоимостно-
го показателя от параметров объекта, то понятно стремление учесть как можно больше
влияющих параметров и построить тем самым более точную множественную корреляци-
онную модель. Однако расширению числа параметров препятствуют два объективных
ограничения. Во-первых, для построения множественной корреляционной модели требу-
ется значительно более объемная выборка объектов, чем для построения парной модели.
Принято считать [40], что количество объектов в выборке должно превышать количество
n параметров-аргументов, по крайней мере, в 5-7 раз. Отсюда следует, что для построе-
ния модели с тремя влияющими параметрами надо собрать выборку примерно из 20 объ-
ектов с разным набором значений параметров. Во-вторых, отбираемые для модели пара-
метры-аргументы в своем влиянии на стоимостной показатель должны быть достаточно
независимы друг от друга. Это обеспечить не просто, поскольку выборка обычно объе-
диняет объекты, относящиеся к одному семейству, у которых имеет место закономерное
изменение многих параметров от объекта к объекту.
На основе представленных выше определений критериев качества регрессионных
моделей можно в компактной форме в виде явных функций представить используемые
для этих целей статистические критерии:
1. Дисперсия:
1 k n
) Y (
S
n
1 i
2 но
i

yx - -
.
= =
.
.
Здесь n - объем выборки, k - количество результативных признаков, вi i
но
i Y Y Y - = . -
ошибка, необъясняемая регрессионной моделью (см. Рис. 4.8), - i Y реальное значение ре-
зультативного признака, вi Y - вычисленное по модели регрессии значение результатив-
ного признака (на рисунке YВi), (n-k-1)= . - число степеней свободы.

Ycp
YBi
Yi
Рис. 4.8
2. Стандартное отклонение (стандартная ошибка или СКО результата):