Unele metode simple de manipulare a datelor

Fără îndoială, secolul XXI poate fi numit un timp de știință și informații. Aceasta este o mare de timp, dar vârsta de informații crește riscul de manipulare a datelor, în scopul de a înșela oamenii.

Hai să vorbim despre cum să se întindă cu ajutorul unor statistici și fapte și uita-te la modul în care să nu scadă pentru escrocherii de momeală și doar pseudo-știință. Deci, aici este cea mai simplă și mai eficiente metode de prezentare a datelor este destul de inofensiv, astfel încât reverie.

eșantionare incorectă

Să presupunem că doriți să efectueze cercetarea lor la nivel global și, prin urmare, pentru a selecta oameni din întreaga lume. Să presupunem că aveți o listă a tuturor oamenilor de pe planetă și ajunge accidental din ea 10 persoane care răspund la întrebările dumneavoastră. Cercetarea vă va permite să suporte cel puțin un anumit sens? Cu greu. Principala greșeală este că, chiar dacă alegeți oameni la întâmplare, numerele lor au fost prea mici pentru a studia a avut cel puțin o anumită valoare. Acesta poate fi foarte ușor ca toate cele 10 de persoane citesc sau, dimpotrivă, nici unul dintre respondenți nu au avut nevoie de cărți în mână. În acest caz, rezultatul cercetării poate concluziona că toți oamenii sunt în mod constant de lectură, sau că nici unul dintre cei care nu sunt interesați de lectură. Nu este studiul cel mai informativ, nu-i așa?

Unele metode simple de manipulare a datelor

Conform statisticilor, 100% din vizitatorii bibliotecilor pentru a citi cărți.

Acesta poate fi interesant:

Unele metode simple de manipulare a datelor
3 de experimente psihologice care explica mult

Cu toate acestea, chiar dacă luați un eșantion de 10 de milioane de oameni, tot nu ar garanta rezultate precise. Să presupunem că, în urmă cu câțiva ani, ați efectuat unele sondaje și la doar 10 de milioane dintre diferiți oameni de știință din întreaga lume. Corect pentru a fi utilizat această probă? Pe de o parte, este într-adevăr mare, dar pe de altă parte, acest lucru este cel mai este că nici o probă părtinitoare. Judecă modul în care omenirea iubește lectura pe cât de mulți oameni de știință citit - e ca sa fie judecat, ce procent este angajat în munca manuală, intervievarea exclusiv instalatori.

Ia-media

Imaginați-vă că doriți să ajungi la compania X și sunteți interesat de salariul mediu în cadrul companiei. Sunteți interesat în raportul de constatare, veți ști că este de 100 000 $ pe an, dar ce anume înseamnă asta? Poate că este cât de mult vă va fi plătită imediat după locul de muncă? Nu. Poate că, după o anumită perioadă de muncă în această companie, cel mai probabil va primi această sumă? Destul de. Deci, ce înseamnă asta? De fapt, din punct de vedere practic, absolut nimic, în cazul în care studiul este mai precis despre ce media în cauză.

Expresia „temperatura medie în spital“ presupune o tentă ironică se datorează faptului că temperatura medie aritmetică a pacienților poate spune că toate acestea sunt sănătoși.

Faptul că există trei medii: media aritmetică, mediana și modul. În cazul mediei aritmetice adăugați la toate valorile și împărțiți suma de numărul de termeni. Median înseamnă că jumătate din valoarea se situează sub această valoare, și jumătate de mai sus. Moda descrie pur și simplu valoarea cea mai comună în set.

Acum, trebuie să înțelegem de ce expresia salariul mediu peste media aritmetică este lipsită de sens. Să presupunem că compania are un CEO cu un salariu de 10 milioane de $, 5 manageri cu un salariu de 300 000 $ și 20 de muncitori cu un salariu de 75 de mii de dolari. Media aritmetică este obținută după cum urmează: (până la 10 000 000 x 5 + 300 000 + x 75 000 20) / (1 + 5 + 20) = 500 000 de dolari. În ciuda faptului că salariul cel mai frecvent (și cel mai probabil, vei primi exact) egal cu 75.000, salariul mediu al companiei se ridică la 500 000, cu toate că, de fapt, ea nu primește unul.

A se vedea, de asemenea:

Unele metode simple de manipulare a datelor
Cum de a începe să se îndoiască în tot și dragoste știință

În acest caz, dacă doriți cu adevărat să evalueze perspectivele financiare ale companiei, cel mai rezonabil să se uite pentru cercetare, în cazul în care este mediana sau chiar moda, dar, în orice caz, nu media aritmetică a tuturor salariilor. Da, probabil, această cifră arată impresionant, dar mediana lumesc sau modul va reflecta realitatea și să fie în măsură să vă ofere consiliere în alegerea unui loc de muncă reale.

grafica cool

Imaginați-vă următoarea situație: ce deține are un grafic care arată venitul Roman Abramovich în ultimul an, și doriți să prezentați venitul companiei dvs., astfel încât acestea să arate mai atractiv decât venitul miliardar celebru.

La prima vedere, pare o sarcină imposibilă, dar este de fapt destul de simplu. Este suficient pentru a schimba scara diagramei pe axa Y. Cu alte cuvinte, în cazul în care valoarea verticală în graficul de venituri Abramovich sunt zeci de milioane de dolari, ceea ce face zeci lor egale de dolari. Acest lucru va atinge efectul dorit.

Cu toate acestea, există o cale mai ușoară: scoateți scala din axa Y., la toate. Acest lucru vă va permite să atragă un grafic cu o astfel de creștere explozivă, cu ceea ce doriti.

Grafica - este distractiv, dar de multe ori complet uninformative.

Selectați cercetarea corespunzătoare

Așa cum ar fi fantastic ca suna, dar cu ajutorul statisticilor se poate dovedi cu ușurință că moneda se încadrează cozi în 100% din cazuri. În plus, acest lucru poate fi realizat chiar și cu date de experți independenți de laborator (formularea familiar?). Esența experimentului este după cum urmează: lasa laboratorul rezolva doar o monedă de 5 ori. Având în vedere că de fiecare dată când cade un vultur, puteți trage concluzia că vulturul se încadrează în 100% din cazuri. Care-i smecheria? Faptul că ați angaja de fapt mai multe zeci de laboratoare, fiecare dintre acestea a fost la fel: aruncă o monedă de 5 ori. După aceea alegeți doar laboratorul care va arunca o monedă ca ai nevoie.

Dacă credeți că în viața reală, astfel de trucuri nu sunt aplicabile, amintesc de diverse inscripții pe produse în stilul de „Pasta de dinti a devenit cu 25% mai eficient decât înainte,“ sau „nouă pulbere îndepărtează petele cu 30% mai mult decât pulberea convențională.“ În acest caz, există, de obicei, o notă „dovedit de către un laborator independent.“ Te simți în cazul în care ciupituri de pantofi?

Trucuri cu vizualizare

Imaginați-vă că Compania Un angajat câștigă 100 $ pe zi, iar societatea B numai 50. Dacă sunteți o companie și proprietarii și doresc să atragă noi angajați, pe care doriți să maximizeze utilizarea faptului că muncitorii câștigă de două ori mai mult decât angajații concurent. Puteți desena pur și simplu un grafic pe care coloana „salariul în Compania A„este un 2 ori mai mare decât compania coloana B.

Dar puteți face vizualizarea si mai spectaculos. Concentrați-One: axa Y a graficului nu pornește de la 0, și, de exemplu, $ 30 de ani. Astfel, diferența vizuală nu că, în 2 ori este, și în toate 3.5. Fără îndoială, puteți începe să construiască și $ 40 - de până la 6 ori mai mare decât diferența va arata chiar mai semnificativ.

În plus, este posibil să se tragă saci cu un semn dolar pe ele, ca personificare a banilor, precum și diferența dintre salariile folosindu-le. Pe de o parte, compania A 2 corespunde sac pentru $ 50 și societatea B doar 1. Dar, din nou, acest lucru nu este suficient în mod eficient. Hai mai bine să atragă un sac care să reflecte salariul în Compania A, de două ori mai mult decât punga corespunzătoare pentru companie B.

Ilustrația din cartea „Cum să se întindă cu statistici folosind“

Trucul este că, în loc să crească zona de sac de 2 ori (dacă este vorba despre o imagine bidimensională a pungii), vom crește fiecare parte de 2 ori. Astfel, diferența vizuală obținută prin 4 ori. Desigur, dacă vrem să facem o versiune tridimensională a ilustrația noastră, diferența se va ridica la 8 ori.

relații cauzale complexe

Să presupunem că un psiholog școlar alocat pentru a examina relatia dintre fumat si rezultatele elevilor. Un psiholog studiază datele relevante devine astfel: printre cei buni elevi ai copiilor nimeni nu fumuri, în timp ce fumatul printre underachieving totul. Asta înseamnă că fumatul afectează negativ progresul de învățare? Nu este faptul.

A se vedea, de asemenea:

Unele metode simple de manipulare a datelor
Explicate mai bine: Cum se calculează temperatura medie în spital

Faptul că nu ne-am dat seama ce este cauza, și că - ancheta. Pe de o parte, fumatul poate fi o cauza de performanta slaba de student. Dar, pe de altă parte, poate fi cu ușurință ceea ce împinge performanța slabă a elevilor pentru a deveni fumători.

În acest caz, avem de-a face cu o corelație (relație între două variabile), dar corelația - nu există o relație cauză-efect. În primul rând, nu este întotdeauna clar care este cauza și efectul, iar pe de altă parte, corelația între oricare dintre valorile nu este întotdeauna și la toate are sens practic.

exemplu Canonicitatea de corelare contrafaceri

erori

Este foarte important să se acorde atenție unei erori în cercetare. Imaginați-vă că doriți să măsoare un câmp a cărui lungime este de 100 de metri (dar nu știu). Fiecare pas pe care il ia este egal cu aproximativ 1 metru, dar la 100 de metri, s-ar putea fi bine confundat la trei metri. Cu alte cuvinte, măsurarea câmpului, puteți trage concluzia că este egală cu lungimea și 97, și 99, și chiar 103 de metri. În acest caz, eroarea este egală cu 3%.

Să ne uităm la un exemplu în cazul în care neglijarea studiului de calcule de eroare poate duce la rezultate absurde. Un test de bine-cunoscut pentru măsurarea IQ Stanford-Binet este eroarea în rezultatele măsurătorilor 3%.

Acum, imaginați-vă că copilul a primit un rezultat de 97 de puncte, iar copilul B - 103. Având în vedere că 100 de puncte - acest secundar (sau „normal“) este obținut, ca urmare a copilului A sub medie, iar copilul B - peste medie. Cu toate acestea, dacă ne amintim că eroarea de măsurare de 3%, se poate întâmpla cu ușurință că este într-adevăr un copil Un rezultat de 103 de puncte, iar copilul B, din contră, 97. Prin urmare, să spunem că copilul mai inteligent și B, pe baza IQ-test (care, în general, este absurd), - nu cea mai bună idee.

concluzie

Noi am considerat doar tehnicile cele mai comune pentru manipularea datelor folosind statistici. Cu toate acestea, dacă doriți să continue să exploreze acest subiect, recomand cartea „Cum să se întindă cu ajutorul statisticilor.“

Principalul lucru - nu lăsați cunoștințe pe plan teoretic. Data viitoare, cand te uiti la un alt studiu sau raport (în special atunci când se va concentra pe activitatea desfășurată de către președinte pentru ultimii patru ani), încearcă să abordeze problema mai sceptic și de a afla ce este în discuție, și ce înseamnă rezultatele.