erori de eșantionare
Acasă | Despre noi | feedback-ul
De la unul și același volum populație N poate extrage o multitudine de volum diferit predeterminat de n eșantioane. Apoi, în fiecare caz, caracteristicile eșantionului calculat din abaterea generală va fi diferit, adică diferite erori sunt extrase mostre. Dacă vom calcula media erorilor tuturor eșantioanelor posibile ale unui volum predeterminat extras din una și aceeași populație, obținem caracteristica lor generală - eroarea medie de eșantionare ().
Eroarea medie a eșantionului arată cum parametru deviază set medie de probă de parametrul general corespunzător.
În teorie, observarea eșantionului sunt două modalități de selecție a unităților de populație: re-eșantionare fără înlocuire.
o astfel de selecție Nonrepetitive este, ca urmare, care odată selectat în unitatea de observare probă nu poate fi selectată din populația generală pentru a doua oară.
Re - selectarea, care a dus la unitatea de observare probei revine în totalitatea ei, și poate fi selectat în al doilea, al treilea etc.
Limitarea eroare de eșantionare () este egal cu t - un multiplu al erorii medii de eșantionare (în selectiv factorul teoretic t numit coeficient de încredere).
Nivelul limitei de eroare de eșantionare depinde de următorii factori:
- gradul de variație a unităților de populația generală;
- circuite de selecție selectate (selecție nonrepetitive oferă o cantitate mai mică de eroare);
- nivel de încredere.
În cazul în care dimensiunea eșantionului este mai mare de 30, valoarea T este determinată de tabelul de distribuție normală, în cazul în care mai puțin - pe masa de distribuție Student.
Construirea limitelor de încredere pentru media generală, iar cota este după cum urmează:
Definirea mediei generale și proporția limitelor include următoarele etape:
- găsirea valorii medii eșantionului (sau fracției);
- determinare, în conformitate cu circuitul de eșantionare selectat și vizualizarea eșantionului;
- Atribuirea probabilitate de încredere P și determinarea factorului de încredere t;
- calcularea limitei de eroare de eșantionare;
- construcția a intervalului de încredere pentru media (sau fracției).
În statistică, în funcție de metoda de selecție următoarele tipuri de probe: auto-aleatoare,,, serial, combinație, mai multe etape, în mai multe faze tipic mecanică și un mic eșantion.
3.1 Într-adevăr, un eșantion aleatoriu
Setul de probă este generat de selecție aleatorie a unităților individuale ale populației țintă.
Înainte de a efectua prelevarea de probe de auto-aleatoare, trebuie să vă asigurați că toate unitățile din populația generală au șanse absolut egale de a intra în eșantion. Acesta ar trebui să stabilească, de asemenea, un set general de delimitare clară, astfel încât să includerea sau nu includerea unei unități separate, nu este pusă la îndoială.
eșantionare auto-aleatoare poate fi fie repetitive, și-repetiție liberă.
Tabelul 1 - Formulele pentru calcularea erorii medii a auto-randomizat
În evaluarea medie la estimarea proporției Atunci când se estimează totalul valorilor caracteristice
3.2 eșantion Manual
eșantionarea mecanică este utilizat în cazurile în care populația generală în orice mod ordonat, de exemplu, există o anumită secvență în aranjamentul unităților.
Unitatea de selecție se face în eșantion din populația generală, rupte în intervale egale. Astfel, la 2%, proba este luată în fiecare unitate de 50-lea. Astfel, în conformitate cu selectarea fracției populației generale rupte mecanic în grupuri egale. Din fiecare grup în eșantion este luată, doar o singură unitate.
Pentru a asigura reprezentativitatea eșantionului, toate unitățile din totalul populației ar trebui să fie plasat într-o anumită ordine. Atunci când a ordonat întreaga populație unei caracteristici esențiale în eșantion ar trebui să fie selectată este unitatea care se află în mijlocul fiecărui grup. Acest lucru evită eroarea de eșantionare sistematică.
Eroarea medie de eșantionare pentru selectarea mecanică calculată prin formulele de fapt randomizate la metoda de selecție nonrepetitive (vezi. Tabelul 1).
3.3 eșantion tipic
Atunci când eșantionul tipic din populația generală este împărțită în grupuri omogene tipice. Din fiecare grup de unități auto- sau accidentale mecanice eșantionați individuale de selecție din eșantion. Reprezentativitatea eșantionului furnizat de disecția tipic calitativ grupe omogene. Acest lucru conduce la o reprezentare în eșantionul fiecărui grupe tipologice. Grupurile sunt formate fie de unitățile tipice de grupare populația generală, sau pot fi folosite de grup existent în mod natural existent.
Formule pentru estimarea erorii medii de eșantionare pentru media și proporția arătată în tabelul 2.
Tabelul 2 - Formulele pentru calcularea erorilor medii de eșantionare, atunci când se utilizează selectarea tipică proporțională cu volumul de grupe tipice
În evaluarea medie la estimarea proporției Atunci când se estimează totalul valorilor caracteristice
- dispersia medie grup de grupe tipice
3.4 Burst (imbricare) eșantion
numita probă continuă la care selecția aleatorie sau omogen mecanic unul cu celălalt (în raport cu trăsătura studiat) serii sau grupuri de obiecte, și monitorizarea apoi continuă a tuturor unităților care constituie seriile selectate (grupul cuib).
În practică, agenția de statistică Rosstat serie țară centrală de eșantionare a constatat utilizat destul de larg în studiul producției agricole, statistica populației, în cazul în care cuiburi sunt adesea definite entități teritoriale preluate în mod aleatoriu, fără repetiții sau baze mecanică totalitatea teritoriilor.
Eroarea medie de eșantionare serială depinde numai de valoarea abaterii medii pătrat de mediu de producție (dispersia mezhseriynaya) media generală, ca în care selectarea unei (vnutigruppovoy) dispersia nu influențează vnutriseriynoy datorită faptului că toate unitățile sunt testate fără excepție selectate în cuiburi.
În cazul seriilor egale valoare de selecție este eroarea probei de mijloc cu formula dată în Tabelul 3.
TABELUL 3 - Formula pentru calcularea mediei de eroare de eșantionare în cazul selecției egale serie de serie
În evaluarea medie la estimarea proporției Atunci când se estimează totalul valorilor caracteristice
- mediu de dispersie mezhseriynaya; - cota mezhseriynaya varianță; R - numărul se execută în populația generală; r - numărul de serie în eșantion.
3.5 probă mică
Volumul eșantionului necesar este determinat pe baza unei erori predeterminate cercetător magnitudinea de eșantionare, probabilitatea de încredere, și metoda de selecție. Cu toate acestea, în unele cazuri, eliminarea numărului necesar de unități este imposibil sau impracticabil din cauza costurilor financiare și umane ridicate. În aceste cazuri, recurgerea la probe de mici, al căror volum poate ajunge la doar 5 - 6 unitati.
Utilizarea probelor mici, ar trebui să se limiteze la situațiile în care distribuția caracteristică a populației este normală sau aproape de ea. Numai în aceste cazuri, sau intervale de încredere construite probabilitatea de încredere calculată va avea o semnificație practică reală.
Proba este considerată mică dacă numărul de obiecte selectate pentru observarea selectivă nu depășește 20 de unități.
În legătură cu un astfel de volum mic de probă pentru a determina erorile formule de eșantionare care au fost utilizate anterior pentru eșantioane mari, sunt inadecvate și necesită ajustări. Acest lucru se datorează faptului că erorile în determinarea valorii eșantion a varianței populației luată în mod convențional egală cu variația de eșantionare.
Într-adevăr, eroarea pe care acestea diferă - pentru n mare (mai mult de 100 de unități), devine irelevant. Când cantitatea mică de creșteri coeficient unități de probă, iar dispersia trebuie determinată în alte moduri, și anume:
Eroare medie mică probă poate fi definită ca fiind.
Limita de eroare mic eșantion :.
Distribuția valorilor eșantionului înseamnă întotdeauna are o distribuție normală (sau aproape), cu. indiferent de natura distribuției populației. Cu toate acestea, în cazul probelor mici, există o altă lege de distribuție - distribuție Student. În acest caz, factorul de încredere stocate în tabelul t - distribuție Student în funcție de nivelul de încredere al P, iar mărimea eșantionului n.