validitatea testului
Testele de conformitate a măsura proprietății mentale, numite de testare VALNDNOSTYO. Acest lucru este, fără exagerare, cea mai importantă caracteristică a testelor psihometrice. În cazul în care fiabilitatea ridicată a testului ne spune că testul măsoară într-adevăr ceva, valabilitatea de mare ukazyvaet.na că măsurile de testare exact ceea ce ne dorim. Desigur, validitatea testului, de asemenea, influențată negativ de factori aleatori. Prin urmare, în psihometrie acceptat psihometrice următoarea inegalitate de bază:
Cercetarea este dominată de criterii speciale de laborator. De exemplu, a construit un chestionar de test compact de anxietate. În laborios experiment de laborator special obiectiv în care reproduce o adevărată anxietate situație (voluntari de testare YZ da naștere unor acțiuni eronate lovituri curente și t. P.) este utilizat drept criteriu de valabilitate a acestuia.
Foarte des, deoarece criteriile de validitate utilizate evaluării experților. De exemplu, vrem să ne asigurăm că un scurt test pentru a măsura nivelul de disciplină este valabilă. Pentru acest sondaj profesorii cu privire la nivelul de disciplină este bine cunoscut pentru ei studenți. Și apoi vom compara (rezultatele testelor) Corelarea și evaluare a experților pentru disciplina elevilor.
Să ne puțin aici în detaliu acest ultim exemplu. Aici avem una dintre ele însele metode simple și populare de empirice (statistice) de valabilitate de măsurare. Această metodă este grupuri bine cunoscute. Pentru a participa la experimentul psihometrice validitatea testului sunt invitați să verifice subiectele, care sunt cunoscute în grupul din care fac parte criteriul PS. În cazul elevilor de test de disciplină selectate disciplinat în mod clar în funcție de profesori (criterii defecþiuni ridicat Group), și, desigur, nedisciplinat (criteriul grupului scăzut). Elevii cu media criterii de testare nu participă. După încercare, ne așteptăm ca, de exemplu, corelarea pur și simplu tetrachoric între test și criteriul. Pentru a face acest lucru, se umple cu tabelul tetrachoric:
Element și prin aceea că placa - este numărul de subiecți care aparțin unei benzi ridicate de test și după criteriul, b elementul - numărul de subiecți care aparțin unui grup de test la mare, dar scăzut asupra grupului criteriu, etc ...
Evident, atunci când valabilitatea completă a elementelor de testare ft și tabletele ar trebui să fie zero. Adică, testul nu ar trebui să dea erori - să spunem că nizkodistsiplinirovanny elev atunci când profesorii spun că elevul este extrem de disciplinat (cazul).
Măsura de potrivire (corelare) între sfârșitul grupurile de testare, iar criteriul este evaluată folosind cel mai simplu coeficientul Phi Guilford:
Atunci când numărul de grupul testat de 30 de persoane (acest lucru este eșantionul minim pentru a verifica validitatea a) o asociere semnificativă statistic cu criteriul de testare, putem spune că Phi> -0,36. Deși este, desigur, valabilitate foarte scăzut, dar încă testul în acest caz dă rezultate semnificativ mai bune decat ghicitul aleatoare. Aceasta este în cazul în care școala este concurență și pe care doriți să îl selectați nu sunt doar talentat, dar, de asemenea, studenții disciplinat, puteți utiliza testul, valabilitatea pe care le-ați verificat și sa dovedit a fi semnificative.
Metoda de cunoscute grupuri are un dezavantaj serios. El nu este întotdeauna posibil să se utilizeze testul pentru predicție. Faptul că formarea unor grupuri bine cunoscute pentru a evalua comportamentul care a avut loc în trecut și dorim să facem un comportament prognoza zi de testare, care va avea loc în viitor. Multe dintre testele utilizate în psychodiagnostics educaționale au aceste dezavantaje. Ei au fost, cel mai bun caz, printr-o procedură cunoscută grupurile și nu au așa-numitele PROGNOSTIC VALYDNOSTYU (sau cel puțin valabilitatea acestei dovedit a fi riguros experimental). Desigur, la nivel local, sarcina de a oferi validitate predictivă nu poate fi rezolvată. Acesta este doar de mare centru științific și metodologic. După un studiu psihometric pentru a verifica validitatea predictivă este necesară pentru a atrage aproximativ de zece ori mai multe discipline - nu 30, și cel puțin 300. De fapt, noi pur și simplu nu știu care unul dintre acestea 300 va scădea în viitor, în cadrul grupurilor extreme.
De exemplu, dorim să folosim testul pentru predicția de pregătire a studenților la formare în liceu. Aceasta este o sarcină psihopat tipic predictivă. Cineva trebuie să-și asume dificil program multi ani, testul de prognostic potențialul acestui test. Este necesar să se testeze cele 300 500 de elevi, și apoi așteptați pentru unul dintre ei pentru a merge la colegiu și să aibă succes acolo pentru a învăța. După două-trei intervale pot fi formate grupa criterial și se calculează un test de corelare cu aceiași parametri ai celor fostei școli. Numai după punerea în aplicare a unui astfel de sistem de experiment psihometric, se poate argumenta că testul a fost validat validitate predictivă. Fără acest lucru, vom continua pur și simplu, din cauza credibilității științifice dezvoltator de testare intuiție și nu avem nici o dovadă independentă că testul poate fi utilizat pentru predicție.
scheme normale Distinguishing ieftine de validare a testelor (din grupurile cunoscute) și scheme costisitoare de validare a testelor predictive - un element esențial al educației psihodiagnostic nu numai pentru psihologi, dar, de asemenea, pentru profesori, pentru care contează, pentru orice client de informații psihodiagnostice.
În cazul în care clientul nu stie sigur, nici o dovadă a eficienței testului propus, ar putea fi solicitate de testeri, este fiabil în condiții de siguranță de la blasfemii.