Să examinăm măsurarea variabilelor aleatoare (h

Interval de încredere - interval, care va acoperi valoarea necunoscută a distribuției estimată a parametrului cu o probabilitate predeterminată (în general, se referă la orice valoare măsurabilă).

Evaluarea unui parametru de distribuție cu un interval de încredere se numește estimarea intervalului.

Principalul avantaj al estimării intervalului - capacitatea de a caracteriza încrederea în parametrii calculați ai distribuției. De exemplu, se poate spune „Cu probabilitate de 95% din valoarea medie a distribuției normale pentru datele mele vor fi în intervalul de 100 - 102, sau, după cum se poate scrie ,.

De ce am nevoie de o estimare interval? Să presupunem că vrem să aflăm cererea de procesare la orice serviciu Web. Pentru a face acest lucru, vom face unele măsurători: vom trimite în mod constant cereri, de a primi răspunsuri la solicitări, înregistrează timpul între transmiterea unei cereri și primirea unui răspuns (otlika timp). După cum probabil ați observat din înregistrările anterioare, în cursul măsurării, vom obține o mulțime de momente diferite de răspuns. Unele valori apar mai frecvent, unele - mai puțin. Toate acestea sugerează că avem de-a face cu o variabilă aleatoare. Într-o variabilă aleatoare are o lege de distribuție, care este stabilit de un număr de parametri. parametrii de distribuție noi nu știm, dar le putem evalua pe baza eșantionului disponibile (rezultatele măsurătorilor). De exemplu, evaluarea varianța de distribuție normală este variația probei.

Cu toate acestea, evaluarea noastră - este, de asemenea, o variabilă aleatoare. Acest lucru este ușor de văzut, dacă rulați programul de colectare a datelor din prima înregistrare din nou. Vei obține aproximativ aceleași date, dar, cu toate acestea, ele vor fi diferite, și, prin urmare, variația eșantionului va fi diferit. Cu alte cuvinte, această estimare (sau, cum se spune, statistici) depinde de proba specifică.

Conform teoremei limită centrală, atunci când un număr mare de măsurători de distribuție noastre parametru de evaluare are o strânsă distribuție la normal. Prin urmare, cu atât mai mult vom avea un eșantion, variația eșantionului este mai aproape de dispersie (parametrul) din legea de distribuție normală! Dar când să se oprească? Este clar că, dacă vom face 10.000 de măsurători, atunci suntem destul (cu încredere în 99.9999%) va fi în măsură să evalueze cu exactitate valorile reale ale parametrilor de distribuție, dar de multe ori acest lucru nu este posibil. Ajutorul vine estimarea intervalului.

Putem spune: „Nu vrem să facă 10.000 de măsurători, dar este suficient pentru a fi siguri în estimările noastre ale parametrilor de distribuție cu 95%.“ Având încredere de calcul interval poate fi mai bine că pentru un nivel de încredere de 95%, suficient doar 50 măsurători. energie economie substanțială și resurse!)

Notăm probabilitatea de încredere. (. Nivelul de încredere Eng) sau fiabilitate sau încredere - probabilitatea ca valoarea reală măsurată să fie în intervalul de încredere. Valoarea in sine este numit nivelul de semnificație. Matematic, putem scrie acest lucru:
,
în cazul în care - este valoarea reală a intervalului estimat, - o valoare mai mică a intervalului, - partea superioară.

Mă întreb ce a cunoscut deja mai devreme, a fost, de asemenea, numit nivelul de semnificație, dar indică probabilitatea de respingere a ipotezei nule.

Deci, cu atât mai mult, este mai scăzut nivelul de încredere și mai restrâns intervalul de încredere. suficient în mod obișnuit, atunci nivelul de încredere va fi egală cu 95%.

Diferite distribuții ale diferitelor opțiuni și, în consecință, construcția estimărilor intervalului pentru acești parametri sunt diferite.

Intervalele de încredere ale distribuției normale

Să vedem cum arată un interval de încredere pentru așteptarea unei distribuții normale, cu o deviație standard cunoscută (amintiți-vă, deviația standard - este rădăcina pătrată a varianței). Se ridică întrebarea, cum putem fi conștienți de abaterea standard? Această caracteristică a variabilei aleatoare poate fi definită, de exemplu, în producerea oricărui proces tehnic produs ar trebui să ofere o deviație standard predeterminată. În această situație, intervalul de încredere construit pe baza unui eșantion aleatoriu va ajuta la determinarea - dacă produsele sunt fabricate ca standard. proces.

, în care n - mărimea eșantionului; - media eșantionului și, cel mai interesant, - cuantila a distribuției normale standard (de distribuția normală cu o rogojină așteptare = 0 și abaterea standard = 1.) pentru o anumită probabilitate.

Nu vom da toate calculele, de ce atât determinate de intervalul de încredere. Mai puteți citi în [1] (pag. 50-55).

Permiteți-mi să explic din nou despre quantile. Cuantila - este o valoare care este o valoare aleatorie nu va depăși o probabilitate predeterminată. Cuantila - este inversul funcției de distribuție, și anume, .

Statistica de mici mostre

În cazurile în care abaterea standard este necunoscută, iar volumul eșantionului nu depășește 10-30 valorile t-statistici utilizate pentru parametrul de distribuție valoare de evaluare. T-statistică se calculează ca o cuantila de distribuția t (Student de distribuție, a se vedea prima parte a acestei serii de înregistrări.) și este definit printr-un singur parametru - gradul de libertate. Pentru o distribuție normală, unde - volumul eșantionului.

Apoi, intervalul de estimare mat. așteptările vor fi după cum urmează:

, în cazul în care - coeficientul Student (valoarea t statistici cuantila comanda pentru numărul de grade de libertate df = n - 1) - variația de eșantionare,.

Intervalele de încredere de distribuție exponențială

După recordul anterior, am încercat o altă distribuție a datelor disponibile - exponențială. Sa dovedit că este mai potrivit decât distribuția Erlang. Rezultatele de măsurare pot fi găsite pe ilustrația de mai jos și în fișierul atașat ipython notebook-uri. Aparent, acest lucru se întâmplă datorită faptului că distribuirea acestor date specifice nu este lăsat coada.

Prin urmare, continuând exemplul nostru, vom găsi intervalul de încredere pentru parametrul de distribuție exponențială. Apropo, dacă am folosit distribuția exponențială în calcule în cadrul teoriei de așteptare, parametrul numit „intensitate venit, primul servit“, iar el ar fi însemnat timpul mediu de primire a unor noi cereri pe unitate de timp.

Evaluarea este inversul mediei aritmetice a eșantionului, adică,
.

Mesaj de navigare