Construcția curbei normale a datelor experimentale

Aplicată la punctul histogramei. . .... . unde h - tabel pas, conectați o curbă lină.

Dacă curba netedă rezultată similar cu o curbă Gauss, este posibilă prelucrarea datelor statistice prin intermediul distribuției normale.

O modalitate de a construi o serie de date normale de observare a curbei este după cum urmează:

1) și sunt. de exemplu, funcționează metoda;

2) găsi yi ordonată (egalizare frecvență) curba teoretică conform formulei

3) construi un punct (xi. Yi) într-un sistem de coordonate rectangulare și conectați-le printr-o curbă lină.

Exemplu. Având în vedere distribuția statistică

Înainte de a construi curba va da explicații cu privire la ultima coloană a tabelului. Să clarificăm sensul distribuției probabilistice a densității f (x)

Dacă funcția F (x) de distribuție este un proces continuu variabila aleatoare X, apoi, prin definiție, f (x) =. sau într-o altă formă

Diferența dintre F (x + dx) - F (x), așa cum deja cunoscut, probabilitatea ca X presupune valoarea aparținând intervalului (x, x + dx). Astfel, limita raportului dintre probabilitatea ca o variabilă aleatoare continuă ia valoarea aparține intervalului (x, x + dx), lungimea acestui interval Dx (Dx ® 0) este valoarea distribuției densității la punctul x.

Astfel, funcția f (x) determină funcția densității de probabilitate pentru fiecare punct x.

Din calcul știm că incrementul funcției este aproximativ egală cu funcția diferențială, care este,

Deci, ca dx = Dx,

De la (*) rezultă că probabilitatea ca o variabilă aleatoare are o valoare care aparține intervalului. aproximativ egală (în intervalul infinitezimal de ordin superior în ceea ce privește dx) la produsul densității de probabilitate la x la intervalul Dx lungime.

Astfel, produsul în ultima coloană a f (x) dx = f (x) h determină probabilitatea aproximativă X care se încadrează în intervalul Dx = h.

Acum, folosind tabelul de date, a construi o curbă de puncte

(Xi. Yi) într-un sistem de coordonate rectangular (Fig. 32).

Comparând valorile hf W și (x) (sau W și P), verificați dacă distribuția statistică predeterminată poate fi considerată drept subordonat normal.

Elemente de teoria corelare

În multe sarcini necesare pentru a instala și de a evalua dependența studiului unei variabile aleatoare Y de la una sau mai multe alte variabile.

Două variabile aleatoare pot fi asociate fie cu dependența funcțională sau un alt tip numit dependenta de statistică. sau să fie independentă.

relație funcțională strictă este implementată foarte rar, deoarece atât amploarea și una dintre ele este supusă acțiunii în continuare a factorilor accidentali, cu unele dintre ele pot fi comune ambelor unități (sub „general“ de aici se referă la acei factori care au impact asupra Y și X). În acest caz, există o relație statistică.

De exemplu, dacă Y depinde de factorul aleatoriu z1. z2. v1. v2. și X depinde de factorul aleatoriu z1. z2. u1. între Y și X este o relație statistică, ca printre factorii aleatorii au un comun, și anume: Z1 și Z2.

Statistic numit dependență, în care o modificare într-una din cantitățile determină o schimbare în distribuția celuilalt. În special, dependența statistică se manifestă prin faptul că media schimbărilor valorice cu una dintre celelalte valori; În acest caz, corelația statistică se numește corelația.

Aici este un exemplu de aleatoare Y variabilă, care nu este asociată cu valoarea X funcțional și corelația asociată. Să Y - producția de boabe, X - cantitatea de îngrășământ. elimina culturi diferite, adică Y nu este o funcție X. Acest lucru se datorează influenței factorilor aleatorii (precipitații, temperatură, etc.), cu aceeași suprafață a porțiunilor de teren în cantități egale de îngrășăminte. Cu toate acestea, experiența arată că randamentul mediu este o funcție de cantitatea de îngrășământ. adică Y este legat de dependența X corelație.

Corelația dintre două variabile aleatoare poate fi fie liniare sau neliniare.

Fie X și Y - variabile aleatoare dependente. Noi reprezentăm valoarea în funcție de una de alta. Deoarece între diferitele tipuri de corelații sunt cele mai importante linii, ne limităm aproximativă valoare reprezentare Y ca valoare funcție liniară X, adică

unde a și b - parametrii care urmează să fie determinat.

Parametrii a și b pot fi determinate în diferite moduri. Cele mai frecvente - metoda celor mai mici pătrate.

Funcția se numește cea mai bună aproximare a Y, în sensul metodei celor mai mici pătrate, în cazul în care speranța ia cea mai mică valoare posibilă. În acest caz, funcția g (X) se numește regresie pătrată a mediei aritmetice Y H.

Următoarea teoremă deține.

Teorema. Regresie liniară medie pătrată la Y este de forma X

Cantitatea rxy numit coeficientul de corelație X mărimi și Y. Coeficientul de corelație

în care MHU - corelarea moment al variabilelor aleatoare X și Y, egală cu produsul medie a abaterilor acestor valori, adică