Estimările pentru așteptările și variația

Cele mai importante caracteristici ale valorilor numerice aleatorii mx sale X așteptare = M [x] și varianța # 963; 2 x = D [x] = M [(X - mx) 2] = M [x 2] -. Numărul MX este valoarea medie a variabilei aleatoare, care sunt împrăștiate în jurul măsura valorile X. acestei variații este variația D [x] și deviația standard:

Vom în viitor concider o sarcină importantă pentru studiul variabilei aleatoare observabile. Să fie o probă (vom nota aceasta S) a variabilei aleatoare X ia pe eșantionul existent pentru a estima valoarea necunoscută, și MX.

Teoria diferitelor estimări ale parametrilor este importantă în domeniul statisticii matematice. Prin urmare, să ne gândim mai întâi problema generală. Să presupunem că dorim estimarea unui parametru al unei probe S. Fiecare astfel de estimare a * este o funcție a * = a * (S) a valorilor eșantion. Valorile de eșantionare este aleatoriu, și, prin urmare, estimarea în sine un * este o variabilă aleatoare. Puteți construi mai multe evaluări diferite (de exemplu, funcțiile) o *. dar este de dorit să aibă un „bun“ sau chiar „cel mai bun“, într-un anumit sens, o evaluare. Prin estimări de obicei îndeplinesc următoarele trei condiții naturale.

1. imparțial. Așteptarea estimează o * ar trebui să fie egală cu valoarea exactă a parametrului: M [a *] = a. Cu alte cuvinte, evaluarea unui * trebuie să fie liber de părtinire.

2. Coerența. La infinit probă în creștere estimarea volumului o * trebuie să conveargă la o valoare exactă, adică atunci când numărul de observații estimarea de eroare tinde la zero.

3. Eficiența. Calificarea un * se numește eficientă dacă nu este deplasată, și are posibila eroare minimă variație. În acest caz, estimarea de variație minimă a valorilor * și evaluarea relativ corecte într-un anumit sens este „cel mai precis“.

Din păcate, nu întotdeauna posibil să se construiască o evaluare care satisface toate cele trei cerințe simultan.

Pentru a evalua așteptările de evaluare utilizate cel mai frecvent.

adică, media aritmetică a eșantionului. Dacă variabila aleatoare X are o mx finită și sx. atunci (1.12) nu este deplasată și este consecventă. Această estimare este eficientă, de exemplu, în cazul în care X are o distribuție normală (ris.p.1.4, Anexa 1). aceasta nu poate fi eficace pentru alte distribuții. De exemplu, în cazul distribuției uniforme (ris.p.1.1, Anexa 1) echidistantă, estimare consecvente va

În același timp, estimarea (1.13) pentru distribuția normală nu ar fi nici consecvent, nici eficace, și va fi chiar mai rău, cu creșterea mărimii eșantionului.

Astfel, pentru fiecare tip de distribuție a variabilei aleatoare X ar trebui să utilizeze estimare a așteptărilor. Cu toate acestea, în cazul nostru, tipul de distribuție poate fi cunoscut numai provizoriu. Prin urmare, vom folosi estimarea (1.12), care este simplu și are cele mai importante proprietăți ale echidistantă și consecvență.

Pentru evaluarea eșantionului așteptare grupate folosind următoarea formulă:

care poate fi obținut din cea precedentă, presupunând toate eșantion valori km aparținând unui al i-lea interval egal cu Zi reprezentativă interval. Această estimare grosieră în mod natural, dar necesită un volum mult mai mic de calcul, mai ales atunci când un volum mare de probă.

Pentru a evalua dispersia rating mai frecvent utilizate:

Această estimare nu este părtinitoare și este consecvent pentru orice variabila aleatoare X având puncte finale până la a patra ordine inclusiv.

În cazul utilizării ratei de eșantionare grupate:

Estimările (1.14) și (1.16), deoarece așteptările lor sunt, de obicei părtinitoare și lipsită de temei, precum și limitele la care converg, diferit de mx și din cauza înlocuirii tuturor valorilor eșantion care se încadrează în intervalul i-lea la intervalul reprezentativ zi.

Rețineți că, pentru n mare, factor n / (n - 1) în expresiile (1.15) și (1.16) este aproape de unitate, deci poate fi omisă.

Lăsați valoarea exactă a unui parametru este și a găsit estimarea lui un * (S) în eșantionul S. Evaluarea unui * corespunde unui punct de pe axa reală (figura 1.5), astfel încât o astfel de evaluare este numit un punct. Toate estimările discutate în paragraful anterior, punctul. Aproape întotdeauna, în virtutea hazardului

o * ¹ a. și putem decât să sperăm că punctul de un * este undeva langa. Dar cât de aproape? Orice alt punct de estimare va avea același dezavantaj - lipsa măsurilor de fiabilitate rezultat.

Figura 1.5. Estimarea punctuală a unui parametru.

O mai specifică în acest sens sunt estimările interval. Estimarea Interval este un interval Ib = (a. B). în care valoarea curentă a parametrului estimat este o probabilitate predeterminată b. Interval Ib numit interval de încredere. și probabilitatea b se numește nivelul de încredere al, și poate fi considerată ca o evaluare fiabilă.

Intervalul de încredere deținut de eșantionul disponibil S. Apare în sensul că limitele sale sunt aleatoare a (S) și b (S). care se calculează prin eșantion (aleatoriu). Prin urmare, b este probabilitatea ca un interval aleatoriu Ib va acoperi non-aleatoare litera a. Fig. 1.6. Interval de Ib acoperit o. și Ib * - nr. Prin urmare, nu este în întregime corect să spunem că un «cade» în intervalul.

B Dacă nivelul de încredere este mare (de exemplu, b = 0,999), este practic întotdeauna o valoare curentă stocată în intervalul construit.

Figura 1.6. Încrederea intervale parametru pentru diferite eșantioane.

Să luăm în considerare o metodă de construire a unui interval de încredere pentru așteptarea unei variabile aleatoare X, bazată pe teorema limită centrală.

Să variabila aleatoare X este matematic așteptare MX necunoscută și o variație cunoscută. Apoi, prin teorema limită centrală, media aritmetică:

Rezultatele testelor n independent X variabilă este o variabilă aleatoare a cărei distribuție de mari n. aproape de o distribuție normală cu media și abaterea standard mx. Prin urmare, variabila aleatoare

Are o distribuție de probabilitate, care poate fi privit ca un j standard normală densitate de distribuție (t). al cărui grafic este prezentată în figura 1.7 (a ris.p.1.4 de asemenea, apendicele 1).

Figura 1.7. aleatoare variabilă densitate de probabilitate funcția T.

Având în vedere un nivel de încredere b și tb - numărul satisface ecuația

în cazul în care - funcția Laplace. Apoi, probabilitatea de a cădea în intervalul (-TB. Tb) va fi egal cu hașurată din figura 1.7. zonă, și, în virtutea (1.19) este egal cu b. prin urmare

Astfel, intervalul de încredere se poate lua interval de

deoarece expresia (1.20) înseamnă că valoarea curentului necunoscut Ib mx este într-un nivel de încredere predeterminat de b. Pentru a construi Ib necesară pentru o anumită naytitb b din ecuația (1.19). Iată câteva valori ale tb. necesare în continuare [3. 5]:

În derivarea (1.21), sa presupus că știm valoarea exactă a abaterii standard SX. Cu toate acestea, este cunoscut pentru a nu întotdeauna. Noi folosim atât estimarea (1.15) și obținem:

Prin urmare, evaluarea și. obținute de eșantionul grupat, dă următoarea formulă pentru intervalul de încredere:

De notat că ecuația (1.22) are două erori. Prima se referă la faptul că valorile distribuției numai aproximativ egală cu t j (t). dar cu creșterea mărimii eșantionului precizie n aproximare este îmbunătățită. A doua eroare se datorează, folosind, în loc de valoare exactă necunoscută SX. Cu un volum mare de probă, iar această eroare nu este semnificativ. Formula (1.23) utilizări grupate, adică proba coarsened și, prin urmare, dă rezultatul rămas asprimea și la o creștere infinită a volumului eșantionului.

De asemenea, trebuie remarcat faptul că este posibil să se construiască orice număr de intervale de încredere pentru un anumit b. Într-adevăr, să t'b IT "b îndeplinește condiția = b $ 0 (t" b) - $ 0 (t'b). atunci intervalul

De asemenea, cu o probabilitate de b ea cuprinde mx (Figura 1.7.). De exemplu, se poate lua t'0,9 = - 4 și t „0,9 = 1.282. Dar, în acest caz, lungimea rezultată a intervalului va crește cu aproximativ 1,6 ori. Formula (1.21) este utilizat, deoarece acesta oferă cel mai scurt interval de încredere.

În mod similar estimări interval de alți parametri, astfel de dispersii pot fi găsite [1, 5].