Intervalele de încredere și aplicațiile lor, știința datelor

Având un eșantion dintr-o populație, obținem o estimare punctuală a unui parametru de interes, și vom calcula eroarea standard pentru a specifica acuratețea estimării.

Cu toate acestea, în cele mai multe cazuri, ca eroarea standard nu este acceptabil. Mult mai util să se combine această măsură cu precizie estimările intervalului pentru parametrii populației.

Acest lucru se poate face folosind cunoașterea distribuției de probabilitate teoretică a statisticilor de eșantionare (opțional) pentru a calcula intervalul de încredere (CI -. Intervalul de încredere CI - interval de încredere) pentru parametrul.

În general, estimările de încredere interval se extinde în ambele direcții o anumită valoare, eroarea standard multiple (acest parametru); două valori (limite de încredere), specifică intervalul, de obicei separate prin virgulă și paranteze.

În statisticile, un interval de încredere (CI) este un tip de estimare interval de un parametru de populație. Este un interval observat (adică se calculează din observațiile), în principiu diferit de o probă la alta, care include în mod frecvent valoarea unui parametru neobservabile de interes dacă experimentul se repetă. Cât de frecvent intervalul observat conține parametrul este determinat de nivelul de încredere sau coeficientul de încredere. Mai precis, sensul termenului «nivel de încredere» este că, în cazul în care CI sunt construite în multe date separate analize de experimente replicate (și, eventual, diferite), proporția acestor intervale care conțin valoarea reală a parametrului se va potrivi dat nivel de încredere. Întrucât limitele de încredere cu două fețe formează un interval de încredere, omologii lor cu o singură față sunt denumite limite inferioare / superioare de încredere (sau limite).

Intervalul de încredere indică care va găzdui intervalul de observare eșantion (sondaj). Dacă vom cheltui 100 de anchete similare în probe similare, dintr-o singură populație generală (de exemplu, 100 de eșantioane de 1.000 de persoane în fiecare oraș cu o populație de 5 milioane de persoane), atunci nivelul de încredere de 95%, 95 din 100 rezultate se încadrează în intervalul de încredere (de exemplu, de la 28% până la 32% la valoarea sa reală de 30%). De exemplu, numărul real de fumători rezidenți este de 30%. Dacă vom alege de 100 de ori la rând pentru 1000 de persoane aceste probe pun întrebarea, „Fumezi?“, În 95 dintre aceste 100 de eșantioane la un nivel de încredere interval de valori interval de 2%, de la 28% la 32%.

Intervalele de încredere și aplicațiile lor, știința datelor

Formulele pentru construirea intervalelor de încredere cu exemple practice pot fi găsite, de exemplu, aici.

Interpretarea intervalelor de încredere

În interpretarea intervalului de încredere ne interesează următoarele întrebări:

Cât de mare interval de încredere?

Intervalul de încredere larg indică faptul că estimarea este incorectă; puncte înguste pe o evaluare exactă.
Lățimea intervalului de încredere depinde de mărimea erorii standard, care, la rândul său depinde de volumul eșantionului în analiza unei variabile numerice din variabilitatea datelor dau intervale mai largi de încredere decât studiul a numeroase date stabilite câteva variabile.

Are valori CI sunt de interes special?

Puteți verifica dacă ursul valoarea probabilă pentru populație într-un interval de încredere. În acest caz, rezultatele sunt în concordanță cu valoarea probabilă. Dacă nu, atunci este puțin probabil (la 95% sansa de interval de aproximativ 5%), care are o valoare a parametrului. (Sursa)