Grupate și seriile de date intervalul - studopediya

Deci, să să studieze proprietățile volumul probei variabile aleatoare (rv) X Nx1 obținut. x2, ..., xn>.

Secvența de valori eșantion de x1. x2, ..., xn. înregistrate în ordinea apariției lor, este o sursă de material statistic și a numit-o serie statistică simplă.

Pentru o prezentare compactă, convenabilă și vizuală a datelor statistice disponibile necesare pentru a face procesarea lor inițială.

Notați toate elementele unui eșantion în ordine descrescătoare și lăsați membrii unei astfel de secvențe. . . unde

Fiecare element este numită statistica de ordine (de realizare) și secvența

Se numește seria variațional. relevante de probă existente.

Dacă studiem variabila aleatoare discreta. în care numărul de valori posibile este mare (n <10), то для каждого из отличающихся друг от друга наблюденных значений (обозначим их ) подсчитываются частоты mi и относительные частоты (частости) mi /n появления этих значений в выборке.

Rezultatele calculelor sunt înregistrate în tabelul 1, care se numește statistice grupate.

Tabelul 1 - Numărul statistic torsadate

Dacă studiem valoarea continuă aleatoare sau o variabilă aleatoare discretă, numărul de valori posibile, care este suficient de mare (n> 10), intervalul [xmin (n); xmax (n)] a tuturor valorilor observate partiționate în kh lungime biți. și numărat numărul de eșantioane de date capturate în fiecare dintre biți. Rezultatele calculelor sunt înregistrate în tabelul 2, care se numește seriile statistice interval.

Tabelul 2 - numere aleatoare Interval

Valoarea medie a intervalului

se poate utiliza următoarea procedură pentru a determina limitele intervalelor:

1 Se calculează amplitudinea variației valorilor eșantionate: R = xmax - xmin. în care xmin și xmax respectiv numărul minim și maxim de variații.

2 Determinați lungimea fazei de separare. unde k - numărul de biți ai peretelui despărțitor. Pentru o orientare selectată, k Sturgess poate folosi formula () în care n - mărimea eșantionului. Selectarea numărului de biți semnificativi este dependentă de mărimea eșantionului n. Pentru valoarea n mare obținută din formula R. Sturgess, trebuie luată ca o limită inferioară pentru R (pentru a simplifica calculele ulterioare h valoarea rezultată poate fi rotunjită la bómai mare sau mai mică).

3 Definiți limitele intervalelor de partiție: C1 = xmin - h / 2, C2 = C1 + h. C3 = C2 + h. și t. d. Procesul de descompunere continuă atâta timp cât elementul maxim probă nu se încadrează în intervalul. Valoarea medie a fiecărui interval parțial poate fi definit ca media aritmetică a frontierelor sale.

elementele de prelevare care cad pe limita partiției de biți pot fi atribuite la oricare dintre aceste intervale (de exemplu, spre dreapta, așa cum sa făcut în tabelul 2), sau frecvențele acestor valori pot fi împărțite în mod egal între cele două intervale adiacente.

Pentru reprezentări grafice număr aleator din cluster este utilizat în general bar diagramă (figura 1), care reprezintă o secvență de segmente verticale mi / n lungime. în așteptarea pe abscisă la coordonate.

Pentru imagini grafice serii statistice interval folosit adesea histograma frecvența relativă (Figura 2). Atunci când construirea histograma pe abscisă necesară pentru a întârzia intervale limită valori eșantionate [Ci ,; Ci + 1) () și fiecare dintre aceste intervale de timp, ca bază, pentru a construi dreptunghiuri ale căror zone sunt egale mi / n. atunci înălțimea dreptunghiului este de mi / (nhi). Suprafața totală a histogramei este, evident, egal cu 1.

Figura 1 - bargraf

Figura 2 - O histogramă a frecvențelor relative