Evaluări ca variabile aleatoare

Scorul rezultat este un caz special al variabilei aleatoare. Motivul este că combinație de valori x în eșantion din întâmplare ca x - variabilă aleatoare și, prin urmare, este o variabilă aleatoare și valorile sale set de funcții. Să luăm, de exemplu, - evaluarea așteptărilor:

Sa arătat mai sus că valoarea lui x în observația i -lea poate fi descompus în două componente: o porțiune constantă și o componentă pur aleatoare:

în cazul în care - proba valori medii.

De aici puteți vedea că. Ca x. Ea are atât componente fixe și pur aleatoare. Componenta sa fixă -. că este, așteptarea lui x. și componenta sa aleatoare -. adică valoarea medie a componentei pur aleatorii în eșantion.

Funcția densității de probabilitate x și sunt prezentate în aceleași grafice (Fig. 6). Valoarea lui x este considerată a fi distribuite în mod normal. Se poate observa că distribuția este x. și. simetrice în raport - media teoretică. Diferența dintre ele este faptul că distribuția este deja mai mare. Cantitate. Ar trebui să fie, probabil, mai aproape de. decât valoarea unei singure x observație. deoarece componenta sa aleatoare este media componentelor pur aleatorii din eșantion care aparent „stinși“ unul de altul la calcularea mediei. Apoi, valoarea de dispersie teoretică este doar o fracțiune de dispersie teoretică.

Dimensiunea - estimarea teoretică a varianței x - este, de asemenea, o variabilă aleatoare. Scăzând (18) de la (17) avem:

Astfel, aceasta depinde doar de componenta pur aleatorie în observația eșantionului x. Deoarece aceste componente variază de la un eșantion la altul și de la o probă la alta și valoarea de evaluare variază.

Deoarece estimările sunt variabile aleatoare, valorile lor doar o coincidență poate egala exact caracteristicile întregii populații. anumite erori, de obicei, va fi prezentă, care pot fi mari sau mici, pozitive sau negative, în funcție de pur aleatoare variabile x componentelor din eșantion.

Deși este inevitabil, la un nivel intuitiv, este de dorit, cu toate acestea, pentru a estima media pentru o perioadă suficient de lungă a fost curat. Pentru a pune în mod oficial, am dori să evalueze așteptarea ar fi egală cu caracteristica corespunzătoare a populației. Dacă este așa, atunci estimarea este numit imparțial. Dacă nu este, atunci estimarea se numește offset. și diferența dintre media și caracteristica corespunzătoare teoretică a populației se numește offset.

Să începem cu media eșantionului. Fie că este o estimare imparțială a mediei teoretice? dacă și egal. Da, este faptul că consecința imediată a (18).

Valoarea lui x include două componente - și. Valoarea este media pur aleatoare variabile x componentelor din eșantion și deoarece așteptarea unei astfel de componente în fiecare observație este zero, speranța matematică este egală cu zero. Prin urmare,

Cu toate acestea, evaluarea rezultată - nu numai că este posibil estimator de echidistantă. Pentru simplificare, presupunem că avem un eșantion de doar două observații - și. Orice medie ponderată a observațiilor, și ar fi o estimare imparțială, în cazul în care suma ponderilor este egală cu unu. Pentru a ilustra acest lucru, să presupunem că am construit o evaluare generalizată cu formula:

Așteptarea Z este:

În cazul în care suma este egală cu unul, și atunci avem, și Z este o estimare imparțială.

Astfel, în principiu, numărul de estimări imparțiale pe termen nelimitat. Cum de a alege una dintre ele? De ce, de fapt, folosim întotdeauna proba medie a?

Până în prezent, am considerat doar o evaluare teoretică a mediei. argumentat mai sus această cantitate. determinat în conformitate cu tabelul. 6 este o estimare teoretică a dispersiei. Se poate demonstra că așteptarea la fel. iar această valoare este o dispersie teoretică estimare imparțială, dacă observația din eșantion, independent unul față de celălalt. Dovada acestui fapt este matematic simplu, dar consumatoare de timp, așa că am omite.

Imparțială - o evaluări de proprietate de dorit, dar nu este singura astfel de proprietate. Un alt aspect important al - fiabilitate. Desigur, este important ca evaluarea este corectă, în medie, pe o perioadă lungă de timp. Ne-ar dori să vadă evaluarea noastră cu cea mai mare probabilitate posibilă ar oferi o valoare similară cu caracteristica teoretică, ceea ce înseamnă dorința de a obține o funcție de densitate de probabilitate, cât mai mult posibil „comprimată“ în jurul valorii de valoarea reală. O modalitate de a exprima această cerință - să spunem că vom obține cât mai mult posibil variație mică.

Să presupunem că avem două estimări ale mediei teoretice, calculate pe baza acelorași informații pe care le ambele sunt imparțiale și că funcțiile lor de densitate de probabilitate sunt prezentate în Fig. 7. Deoarece funcția de densitate de probabilitate pentru evaluarea B mai „comprimat“ decât pentru a evalua A. Cu ajutorul ei ne-ar obține mai degrabă o valoare mai precisă. Formal vorbind, această evaluare este mai eficientă.

Am vorbit despre dorința de a obține o estimare cât posibil, cu mai puțin de dispersie și evaluarea eficientă - este una în care variația este minimă. Vom lua în considerare acum variația evaluării generalizată a mediei teoretice și arată că este minimă în cazul în care cele două observații au o pondere egală.

În cazul în care observațiile sunt independente și dispersia teoretică a evaluării generalizate este:

Am descoperit că este necesar pentru suma egală cu una și o estimare imparțială. În consecință, pentru estimări obiective și

Pentru că vrem să fie alese astfel încât să se reducă la minimum varianța, avem nevoie pentru a minimiza acest timp. Această problemă poate fi rezolvată fie grafic, fie prin utilizarea diferențială de calcul. În orice caz, minimul este atins atunci când. În consecință, de asemenea, egal cu 0,5.

Astfel, am arătat că media eșantionului este cea mai mică dintre dispersia estimărilor de acest tip. Acest lucru înseamnă că are o mai „comprimat“ de distribuție de probabilitate în jurul mediei adevărate și, prin urmare, (în sens probabilistic), cele mai exacte. Strict vorbind, media eșantionului - aceasta este cea mai eficientă dintre toate estimatorul estimatori nepărtinitoare. Desigur, ne-am arătat acest lucru este doar cazul cu două observații, dar concluziile sunt adevărate pentru mostre de orice dimensiune, în cazul în care observațiile nu sunt independente una de cealaltă.

Două observații: în primul rând, evaluări de eficiență pot fi comparate numai atunci când folosesc aceleași informații, cum ar fi același set de observații de mai multe variabile aleatoare. Dacă o estimare folosește de 10 ori mai multe informații decât cealaltă, atunci acesta poate avea și o variație mai mică, dar ar fi greșit să ia în considerare mai eficient. În al doilea rând, limităm conceptul de comparație eficiență a distribuției estimatori nepărtinitoare. Acolo determina eficacitatea generalizării conceptului pentru o posibilă comparație estimări părtinitoare.