Coeficientul de determinare

2 - valoarea valorilor observate y dispersiei de medie.

2 = 2 + 2 + 2 2 ()

Vectorul y în formă vectorială:

e „sunt ortogonale reziduuri de vectori.

În cazul în care - suma totală de pătrate, variația totală a lui y în ceea ce privește

unde suma pătratelor reziduurilor de regresie (nu sunt explicate cu regresia POM.) - valorile reale și estimate ale variabilei dependente.

în cazul în care - a explicat prin suma măsurii pătrate de răspândire, explicată prin regresie.

R2 - coeficient de determinare indică ce parte a variabilei endogene de dispersie scatter în ceea ce privește suportul său pot fi explicate vibratii variabile exogene.

R = 2. R2 [0,1].

Coeficientul de determinare pentru modelul cu constantă ia valori de la 0 la 1. Mai aproape de 1 valoarea coeficientului, mai mare dependență. La evaluarea modelelor de regresie este interpretat ca potrivirea modelului de date. Pentru modelele acceptabile presupune că coeficientul de determinare trebuie să fie de cel puțin nu mai puțin de 50% (în acest caz, coeficientul de corelație multiplă depășește modulo 70%). Modelele cu un coeficient de determinare de peste 80% poate fi considerat suficient de bun (coeficient de corelație mai mare de 90%). Coeficientul de determinare 1 este o dependență funcțională între variabile.

1. R2 este crescută prin adăugarea unui alt regresor

2. R2 este schimbat cu transformări simple de variabile dependente.

Problema principală a aplicării R2 este că valoarea sa este mărită prin adăugarea de noi variabile în model, chiar dacă variabilele nu au legătură cu variabila dependentă nu sunt. Prin urmare, compararea modelelor cu număr diferit de factori, utilizând în mod corect coeficientul de determinare. măsuri alternative pot fi utilizate în aceste scopuri.

Pentru a putea compara modelele cu număr diferit de factori, astfel încât numărul de regresori nu afectează statisticile R 2 este utilizat în mod obișnuit coeficient de determinare ajustat. în care dispersiile sunt utilizate estimări imparțiale:

unde n - numărul de observații și k - numărul de parametri.

Acest indicator este întotdeauna mai mică decât unitatea, dar teoretic, ar putea fi mai mică decât zero (atunci când doar o valoare foarte mică, iar coeficientul de determinare a factorilor cantitativi convenționali mari). Prin urmare, interpretarea indicatorului se pierde ca o „cotă“.

Verificarea calității generale a coeficientului de regresie. Testarea ipotezei: H0. .

Statisticile are o distribuție de grade de libertate Fisher-statistici este întotdeauna pozitiv.

Ipoteza H0 este respinsă la nivelul dat de semnificație, în cazul în care executate c. Aceasta înseamnă că varianța explicată este mult mai mare rezidual, adică ecuația de regresie este de o calitate suficientă determină dinamica schimbării în variabila y dependentă.

Testarea ipotezei: H0. .