Psihodiagnostic 1

  • Uploaded by: BlancheAnemone
  • 0
  • 0
  • May 2020
  • PDF

This document was uploaded by user and they confirmed that they have the permission to share it. If you are author or own the copyright of this book, please report to us by using this DMCA report form. Report DMCA


Overview

Download & View Psihodiagnostic 1 as PDF for free.

More details

  • Words: 56,262
  • Pages: 122
PROF.DR. CORNEL HAVÂRNEANU

PSIHODIAGNOSTIC (I)

CUPRINS I. SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI II. MĂSURAREA ÎN PSIHOLOGIE III. METODA TESTELOR IV. FIDELITATEA TESTELOR V. VALIDITATEA TESTELOR VI. STANDARDIZAREA TESTELOR VII. TESTELE DE INTELIGENŢĂ VIII. TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE 1. Tipuri de teste pentru abilităţi de grup 2. Avantajele măsurării factorilor primari 3. Teste de abilitate specifică şi alte teste IX. TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE 1. Sensul aptitudinii 2. Formele itemilor în testarea abilităţilor şi cunoştinţelor X. TESTE PROIECTIVE ŞI OBIECTIVE DE PERSONALITATE 1. Testele obiective 2. Avantajele testelor obiective 3. Tipuri de teste obiective 4. Distincţia dintre testele obiective de abilitate, temperament şi dinamică 5. Ghid practic pentru construcţia testelor obiective de personalitate şi motivaţie XI. ALTE TIPURI DE TESTE PSIHOLOGICE 1. Metodele perceptiv-genetice 2. DMT 3. Testele speciale utilizate pentru pacienţii care au leziuni ale creierului 4. Teste speciale şi liste (checklist) 5. Descrierea modelului circumplex 6. Cercetările lui Plutchik 7. Repertoriul cu test grilă

SCOPUL UNITĂŢII DE CURS (a) să ofere informaţii referitoare la metodele de evaluare psihologică a persoanei (b) să formeze abilităţile necesare evaluării psihologie OBIECTIVE OPERAŢIONALE După parcurgerea acestei unităţi de curs, studenţii ar trebui să aibă următoarele abilităţi: (a) Înţelegerea conceptelor de bază în măsurare şi evaluare, şi înţelegerea caracteristicilor care diferenţiază aceste concepte; (b) Înţelegerea conceptului de fidelitate şi altor concepte specifice teoriei clasice a testelor precum şi a relaţiilor dintre acestea; (c) Aplicarea diferitelor metode de estimare a fidelităţii şi cunoaşterea caracteristicilor şi limitelor acestora; (d) Posibilitatea de a judeca valoarea coeficientului de fidelitate şi de a evalua semnificaţia acestuia în diferite contexte de decizie; (e) Analiza valorii unui coeficient de fidelitate în aprecierea importanţei factorilor analizaţi şi cunoaşterea limitelor fidelităţii; (f) Înţelegerea conceptului de validitate, distingerea diferitelor sale faţete şi determinarea valorii predictive; (g) Evaluarea şi interpretarea validităţii de conţinut şi a validităţii teoretice sau de construct; (h) Transformarea cotelor brute în cote derivate. Realizarea etaloanelor. Interpretarea rezultatelor pornind de la scorurile individuale; (i) Înţelegerea conceptului de inteligenţă şi a modalităţilor de evaluare a inteligenţei (j) Înţelegerea modului de construcţie şi utilizare a testelor pentru abilităţi de grup şi specifice (k) Înţelegerea modului de construcţie şi utilizare a testelor de abilităţi şi cunoştinţe (l) Înţelegerea modului de construcţie şi utilizare a testelor obiective de personalitate (m) Înţelegerea modului de construcţie şi utilizare a altor tipuri de teste psihologice (n) Înţelegerea modului de utilizare a testelor în psihologia educaţională (o) Înţelegerea modului de utilizare a testelor în psihologia clinică MODALITĂŢILE DE EVALUARE VOR URMĂRI (a) Aprecierea studenţilor în cadrul activităţilor tutoriale în care accentul va fi pus pe posibilitatea acestora de a aplica cunoştinţele teoretice (pondere 50% din nota finală); (b) Aprecierea rezultatelor obţinute la examenul scris din conţinutul cursului şi aplicaţiile aferente (pondere 50% din nota finală); NOTĂ ƒ

Prezenţa la activităţile tutoriale este obligatorie deoarece se vor realiza lucrări practice de laborator

PSIHODIAGNOSTIC (I)

I. SCURT ISTORIC AL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE CUNOAŞTERII PSIHOLOGICE A PERSOANEI De-a lungul istoriei umanităţii au existat numeroase preocupări de a găsi metode de selecţie a indivizilor mai productivi sau care să corespundă obiectivelor de formare stabilite Aceste preocupări au dus la o utilizare pe sacră largă a testelor şi altor metode de cunoaştere a persoanei în diferite domenii aplicative fapt care ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor.

I.1. SPIRITUL PSIHOLOGIEI DIFERENŢIALE ŞI ORIGINILE EVALUĂRII DuBois (1970), care este citat în multe manuale de psihometrie, Gregory (1992) şi Sattler (1992), susţin că evaluarea a apărut în China în urmă cu 3000 de ani. Această afirmaţie nu este susţinută de surse istorice. Brawman (1998) consideră că începând cu anul 165 î.Hr. în China se practica selecţia în domeniul serviciilor publice. I.1.1. Originile psihologiei diferenţiale Psihologia diferenţială, ca ramură a psihologiei ştiinţifice , a apărut în Anglia la sfârşitul sec. al XIX-lea, odată cu dezvoltarea empirismului şi ca o prelungire a teoriei darwiniste a evoluţionismului. Dar reflexiile asupra variabilităţii indivizilor sunt mult mai vechi. Încă din antichitate întâlnim reflexii ale filozofilor şi medicilor referitoare la variabilitatea indivizilor. Platon (427-347 î.Hr.), de exemplu în Republica, consideră că există trei tipuri de indivizi corespunzătoare celor trei faţete ale sufletului uman: "dorinţele", "raţiunea" care le controlează, şi "pasiunea" care corespunde sensului moral şi manifestărilor sale. Aceste proprietăţi înnăscute permit indivizilor să ocupe funcţii sociale specifice (producători, războinici, magistraţi) şi societatea este interesată să facă plasamente în funcţie de acestea. Consideraţii asupra variabilităţii interindividuale a făcut şi Aristotel (384-322 î.Hr.) care a fost interesat de diferenţele psihologice dintre rase şi dintre sexe, şi de caracteristicile individuale necesare în exercitarea diferitelor meserii. Hippocrate (460-477 î.HR.), părintele medicinii, descrie patru tipuri temperamentele pe care le interpretează în termeni de "umori" şi de "elemente": colericul (la care predomină bila albă şi focul), melancolicul (cu predominanţa bilei negre şi a pământului), flegmaticul (la care predomina flegma şi apa) şi sanguinicul (la care predomină sângele). Vom recunoaşte în tipologiile moderne ale personalităţii, mai ales în cea elaborată de Pavlov, o mare analogie cu tipurile lui Hippocrate. În evul mediu, evaluarea aptitudinilor s-a practicat târziu în mai multe universităţi europene. Cristian Von Wolff trebuie menţionat deoarece a fost primul care a intuit posibilitatea creării unei ramuri matematice a psihologiei, pe care a numit-o "psihometrie".

5

CORNEL HAVÂRNEANU

I.1.2. Teoria facultăţilor În epoca modernă problema diferenţelor individuale a fost marcată de influenţa teoriei filosofice a cunoaşterii care punea problema originii "ideilor" noaste, cum ar fi conceptele abstracte (Dumnezeu de exemplu), categoriile gândirii (timpul, cauzalitatea) sau operaţiile mentale. Pentru filosofii idealişti ideile sunt înnăscute, şi spiritul nostru are capacitatea de a le prelua direct. Pentru filosofii empirişti ideile sunt elaborate pe baza informaţiilor furnizate de organele senzoriale. În acest cadru al filosofiei idealiste s-a ajuns la definirea spiritului şi a facultăţilor mentale, care permit accesul la cunoştinţe independent de senzaţii şi o descriere foarte generală a sufletului uman. Thomas Reid (1710-1796), fondatorul şcolii ecoseze, prezintă o listă de "capacităţi ale sufletului": douăzeci şi patru de "capacităţi active" ca faima, perseverarea eului, imitaţia, estimarea eului, nevoia de putere, imaginaţia etc., şi şase "capacităţi intelectuale" ca percepţia, judecata, memoria, sensul moral etc. Aceste facultăţi, sau capacităţi se pot manifesta slab sau foarte puternic la indivizi diferiţi, ceea ce presupune existenţa unor diferenţe individuale între aceştia. Dar interesul pentru aceste cadre descriptive este limitat. Ele sunt pure speculaţii iar cercetările psihologiei diferenţiale trebuie să se bazeze pe observaţii sistematice, nu pe observaţii secvenţiale sau pe simpla intuiţie, care nu face posibilă generalizarea. Ele sunt statice şi se bazează pe decupajul unei scheme de funcţionare psihologică. În plus, postulatele ineiste nu oferă posibilitatea abordării dezvoltării indivizilor şi rămân tributare accentuării rolului factorilor ereditari în explicarea diferenţelor interindividuale. Reminiscenţe ale teoriei facultăţilor şi o dezvoltare ulterioară a acesteia găsim şi la precursorii lui Reid în psihologia modernă. Alexander Bain (1818-1903), a reluat teoria facultăţilor mintale a lui Reid, pentru a descrie diferenţele individuale într-o lucrare care abordează personalitatea, publicată în 1861 "Sur l'etude du caractere". Franz Joseph Gall (1758-1828), s-a inspirat mult din această lucrare, în tratatul său de frenologie, care a avut un mare succes pe parcursul secolului al XIX-lea. Pentru Gall există treizeci de facultăţi, fiecare facultate are un loc bine definit pe o regiune a creierului, regiune care este foarte bine dezvoltată. Dezvoltarea creierului poate modifica forma craniului, ceea ce oferă posibilitatea estimării dezvoltării unei anumite facultăţi. Fiecare facultate este plasată într-o anumită regiune a creierului şi această regiune este mai dezvoltată. Dezvoltarea creierului poate modifica forma craniului şi se poate estima dezvoltarea unei facultăţi prin palpare. Expresia "are bosă de..." provine din frenologie (care a fost numită şi craniologie). Azi putem surâde de schematismul frenologiei şi de naivitatea lui Gall, sau putem să ne indignăm de reducţionismul său. Dar această teorie, ca toate teoriile; trebuie situată în contextul epocii în care a apărut. Cert este că teoria frenologică este eronată: dimensiunile psihologice utilizate nu sunt fondate, creierul nu modifică forma craniului. Frenologia are însă meritul de a accentua o idee forte nouă în epocă şi exactă în principiu: localizarea în diferite zone ale creierului a funcţiilor psihice. Frenologia este un bun exemplu de teorie generală (localizările cerebrale) care a fost confirmată prin cercetări diferenţiale.

6

PSIHODIAGNOSTIC (I)

I.1.3. Empirismul anglo-saxon Empirismul a început să se dezvolte în Anglia începând cu Thomas Hobbes (1588-1679) şi John Locke (1632-1704) care publică în 1690 "Essai sur l'entendement humain" (Eseu asupra judecăţii umane), David Hume (1711-11776), contemporan cu empiristul francez Etienne de Condillac (1711-1780), James Mill (1773-1836) şi John Stuard Mill (1806-1873). Pentru empirişti spiritul este o tablă nescrisă (tabula rasa) pe care se înscriu senzaţiile. Problema fundamentală care apare este: cum simplele senzaţii pot da naştere la cunoştinţe sau "idei". Teoria asociaţionistă rezolvă această problemă. La fel ca şi în chimie corpurile simple se asociază pentru a da naştere la corpuri complexe, senzaţiile se asociază pentru a deveni cunoştinţe. Hume prezintă mai multe legi de asociere: elementele se pot asocia prin contiguitate spaţială sau temporală, prin asemănare, prin relaţii de cauzalitate. Filosofia empiristă furnizează teorii extrem de generale şi faptele prezentate nu vizau confirmarea sau infirmarea lor ci, doar simpla ilustrare. Dacă teoria nu este ştiinţifică ea nu oferă o bază pentru dezvoltarea practicii. În sfârşit, gândirea nu poate fi considerată ca un dat al cerului ci, ca un fenomen natural căruia îi putem observa manifestările. Cu toate acestea psihologia diferenţială s-a dezvoltat pornind de la filosofia empiristă. Această origine empiristă a determinat orientarea psihologiei de la sfârşitul secolului al XIX-lea spre introspecţie şi analiza experimentală a fenomenelor senzoriale elementare. Programul ambiţios al acestei psihologii este reconstituirea fenomenelor de conştiinţă pornind de la senzaţii. Dacă empirismul a permis apariţia unei psihologii experimentale el este mai puţin favorabil psihologiei diferenţiale. Pentru a deveni obiect de cercetare, diferenţele individuale au nevoie de o oarecare stabilitate. Aceasta stabilitate relativă îşi poate avea originea într-o puternică determinare ereditară sau în influenţele mediului. În secolul XIX stabilitatea diferenţelor era pusă pe seama determinanţilor ereditari. Empirismul, prin postulatul său de bază tinde să minimalizeze ponderea factorilor ereditari. Bineînţeles, constatăm recunoaşterea existenţei unor diferenţe individuale. "Ideile" nu sunt aceleaşi, sau nu se manifestă în acelaşi fel la indivizi diferiţi. Provenind de la diversitatea senzaţiilor care stau la baza formării lor, originea lor nu are nimic misterios: ele nu sunt decât reflectarea circumstanţelor şi pot fi modificate uşor modificând circumstanţele. Apriorismul ideilor explică interesul scăzut pentru diferenţele individuale, manifestat de Wundt şi o parte din primii psihologi experimentalişti. În cercetarea legilor generale ale asociaţiei variabilitate interindividuală este considerată ca o sursă de eroare de care trebuie să ne ferim. Behaviorismul, fiind curentul psihologic cel mai apropiat de empirism a fost cel mai puţin interesat de studiul diferenţelor individuale. Nu există totuşi incompatibilitate între principiile empirismului şi luarea în consideraţie a diferenţelor individuale stabile. Circumstanţele nu sunt singure responsabile de variabilitatea asociaţiilor. T. Brown (1778-1820) şi A. Bain consideră că aspectele stabile sunt datorate unor caracteristici constituţionale ale indivizilor. Ei evocă şi stabilitatea obiceiurilor formate. Filosoful evoluţionist Herbert Spencer (1820-1903), care va avea o influenţă directă asupra fondatorului psihologiei franceze Theodule Ribot (1839-1916), introduce ineismul în empirism pe baza evoluţiei. El consideră că asociaţiile frecvent repetate în ontogeneză sunt transmise descendenţilor. Diferenţele individuale sunt deci caractere dobândite şi transmise ereditar. Credinţa în ereditatea caracterelor era foarte răspândită în secolul al XIX-lea. S-a demonstrat ulterior că ea era fără fundament. Dorind să găsească bazele stabile ale variabilităţii indivizilor fondatorii psihologiei diferenţiale, Francis Galton în special, se situează în curentul empirist-asociaţionist. 7

CORNEL HAVÂRNEANU

I.1.4. Teoria evoluţiei Prima teorie a evoluţiei a fost formulată de Jean-Baptiste de Lamarck. Finalist, Lamarck credea că materia vie are o tendinţă naturală de perfecţionare. Aceste perfecţionări permit adaptarea la mediu şi aceste caracteristici dobândite sunt transmise la descendenţi. Charles Darwin (1809-1882) este un naturalist care a adunat numeroase observaţii. Lucrarea sa de bază "Originea speciilor un mijloc de selecţie naturală sau lupta pentru existenţă în natură" a apărut la Londra în 1859. Ca şi Lamarck, Darwin credea că speciile se nasc, se transformă şi dispar fără ca Dumnezeu să intervină. Ca şi Lamarck el credea că această evoluţie este foarte lentă. Dar mecanismele de evoluţie imaginate de Darwin sunt total diferite de cele ale lui Lamarck. Pentru Darwin evoluţia este rezultatul unei selecţii care se manifestă pornind de la o variabilitate aleatoare a caracterelor ereditare (prin hazard unele girafe se nasc cu un gât mai lung decât altele, aceasta le permite să ajungă la crengile mai înalte, iar şansa lor de supravieţuire şi reproducere este astfel maximizată). La baza mecanismului imaginat de Darwin se află variabilitatea între indivizii unei specii. Ideea selecţiei naturale este preluată şi de economistul englez Thomas Malthus (1766-1835). Pentru Mathus populaţie sporeşte mult mai rapid decât resursele. Există deci între indivizi o luptă pentru existenţă care se manifestă prin războaie, epidemii, catastrofe, prin care se poate restabili echilibrul între populaţie şi resurse. Şi în natură există o luptă pentru existenţă între indivizi. Lupta pentru existenţă conduce la o selecţie naturală şi la supravieţuirea celor foarte apţi. Impactul teoriei evoluţiei a fost considerabil: omul care era considerat o creaţie a divinităţii devine un produs natural al evoluţiei. Darwinismul a determinat apariţia a două ramuri ale psihologiei: psihologia comparată, care studiază diferenţele şi asemănările dintre speciile animale şi psihologia diferenţială, care studiază diferenţele dintre indivizi. I.1.5. Contribuţia lui Galton la apariţia psihologiei diferenţiale Galton este unul dintre primii savanţi independenţi, toţi ceilalţi mari psihologi au fost universitari; care a desfăşurat o activitate de cercetare în domenii diverse. El explorează sud-estul Africii realizând numeroase observaţii geografice pe baza cărora redactează un manual practic pentru exploratori. Este interesat de mecanică (construieşte un motor cu vapori, rotativ), meteorologie (foloseşte principiul hărţilor meteorologice, descoperă anticiclonii), psihologie generală (realizează un dispozitiv pentru studiul senzaţiilor, a imaginilor mentale şi asociaţiilor). Activitatea sa în domeniul psihologiei are trei mari obiective: descrierea şi măsurarea variabilităţii psihologice interindividuale, demonstrarea originii ereditare a acestei variabilităţi, folosirea implicaţilor teoriei evoluţioniste pentru ameliorarea spaţiului uman (eugenismul). În scopul observării variabilităţii interindividuale Galton inventează testele, probe care permit o observaţie standardizată a conduitei. Acestea au fost realizate prin simplificarea unor situaţii experimentale din laborator, facilitându-se aplicarea lor la un număr mare de subiecţi. În 1884 mai mult de două mii de persoane au fost supuse măsurătorilor antropometrice. Pentru a condensa aceste informaţii şi a putea evalua diferenţele dintre indivizi Galton a inventat etalonarea care permite transformarea unei măsuri a performanţei în rang. Matematicianul belgian Quetelet (1796-1874) consideră că distribuţia caracteristicilor fizice, de exemplu talia, se realizează după legea Laplace-Gauss (distribuţia normală), la fel ca şi erorile de măsurare. Galton consideră că acest aspect este valabil şi pentru caracteristicile psihologice. În acest 8

PSIHODIAGNOSTIC (I)

fel a putut fi stabilit un procedeu de măsură a diferenţelor interindividuale: diferenţele dintre indivizi sunt diferenţele de abatere de la media populaţiei raportată la abaterea standard a distribuţiei populaţiei respective. Distribuţia gaussiană a caracteristicilor psihologice este un postulat. Galton consideră că variabilitatea indivizilor este de origine ereditară şi caută metode pentru a demonstra acest aspect. Cercetarea legilor eredităţii presupune măsurarea asemănărilor între părinţi şi copii în privinţa caracteristicilor fizice. Cu această ocazie, după 1880, el a inventat coeficientul de corelaţie, tehnică care a fost perfecţionată mai târziu de Karl Pearsons (1857-1936) prin folosirea teoremelor stabilite anterior de matematicianul francez Bravis. Coeficientul de corelaţie BravisPearsons, ca indice de corelaţie, a fost frecvent folosit în psihologia diferenţială. Galton a pus bazele metodei de studiere a gemenilor, comparând gemenii de acelaşi sex cu gemenii de sexe diferite (distincţia dintre gemenii monozigoţi şi cei dizigoţi a fost făcută mai târziu). Galton a fost interesat şi de posibilitatea de intervenţie socială şi a pus bazele ştiinţifice ale cercetărilor în domeniul eugeniei. În 1907 el a pus bazele unui laborator pentru studierea eugeniei în care s-a elaborat toată statistica modernă. Eugenismul lui Galton constă în evitarea transmiterii genetice anormale, ceea ce este o preocupare curentă şi azi. Galton caută înlocuirea selecţiei naturale printr-o selecţie raţională bazată pe teoria evoluţiei, fiind în acest fel partizanul unui eugenism pozitiv.

I.2. APARIŢIA ŞI EVOLUŢIA PSIHOMETRIEI Psihometria este o disciplină mai puţin cunoscută în ştiinţele umane datorită recunoaşterii sale tardive în mediile ştiinţifice şi a dificultăţii pentru oamenii de ştiinţă şi lexicologi de a stabili definirea şi particularităţile sale. Cristian Van Wolf, în 1732, a recunoscut că psihometria se leagă de psihologie şi de măsurare, urmând să se stabilească dacă este vorba de o ramură a psihologiei, o ramificaţie a măsurării, sau ambele. După Legendre (1993), psihometria este "măsurarea şi prelucrarea statistică a faptelor psihice, mai ales prin metoda testelor". Pentru De Landshere (1979), psihometria constă într-un "ansamblu de operaţii care, prin probe speciale (teste) şi tehnici ştiinţifice, determină şi evaluează capacităţile psihice ale indivizilor: stabilirea nivelului mental, detectarea tendinţelor caracteristice, estimarea aptitudinilor profesionale etc.". Paul Dickens, Jocelyne Tournois, André Fieller şi Jean-Luc Kop (1994) "psihometria constă într-un ansamblul de teorii şi metode de măsurare în psihologie ..., care nu se confundă cu studiul testelor ci numai cu analiza datelor... şi care poate exista fără nici o referire la teste". De-a lungul istoriei umanităţii au existat preocupări de a găsi metode de selecţie a indivizilor care să corespundă obiectivelor de formare sau să fie mai productivi. Utilizarea pe sacră largă a testelor în diferite domenii aplicative ne oferă posibilitatea stabilirii unei cronologii a evoluţiei lor. După Mercier (1897), Wundt a fost primul care s-a interesat de psihometrie. În 1879, a înfiinţat la Leipzig primul laborator de psihologie experimentală. Cercetările realizate au fost orientate spre procesele senzoriale, mecanismele perceptive, dar şi asupra unor funcţii complexe ca atenţia, memoria şi emoţia. Metodele de observaţie erau precise şi au fost realizate numeroase aparate de investigaţie psihologică. În timp, mulţi psihologi ca Hall, Cattell, Spearman, Titchner, au vizitat acest laborator preluând modelul pentru propriile lor universităţi. 9

CORNEL HAVÂRNEANU

În 1888, Cattell deschide un laborator pentru testare, iar în 1890 propune două serii de probe numite "teste mentale". Thorndike şi Lohman (1990) a publicat lista acestor teste: 1. presiune dinamometrică; 2. viteza de mişcare a braţelor; 3. ariile de sensibilitate şi de discriminare tactilă; 4. presiunea necesară pentru cauzare a unei dureri; 5. măsurarea sensibilităţii diferenţiale pentru o greutate de 100 de grame; 6. timp de reacţie simplu la sunet; 7. timpul necesar pentru denumirea culorilor; 8. divizarea unei lungimi de 50 de centimetri în două părţi egale; 9. evaluarea unei durate de 10 secunde; 10. numărul de litere reţinute după o singură prezentare auditivă. Pe lângă acestea a mai folosit o probă pentru copii formată din 50 de teste distincte, 14 pentru senzaţii vizuale, 8 pentru audiţie, 3 pentru gust şi miros, 7 pentru senzaţii presiune şi termice. Utilizarea acestor teste nu a dus la un progres în diagnosticul aptitudinilor iar aceste instrumente au continuat să fie utilizate pentru cercetarea psihologică. Binet şi Henri (1896) reproşează faptul că se insistă pe investigarea proceselor psihice inferioare, senzaţii şi mişcări elementare, în detrimentul funcţiilor superioare care caracterizează mai bine un individ. La om este mai important să cunoaştem capacităţile de atenţie, imaginaţie şi inteligenţă decât aptitudinile tactile sau olfactive. Jurnalele psihologice şi medicale din acea perioadă prezentau multe probe care nu erau organizate în ordinea dificultăţii crescătoare. În încercarea de a sistematiza rezultatele obţinute, Spearman (1904) recurge la analiza factorială şi constată că folosind coeficienţii de corelaţie putem obţine un factor general şi mai mulţi factori specifici pentru fiecare test. Această descoperire a stat la baza teoriei celor doi factori. În 1905, Binet şi Simon realizează scara metrică a inteligenţei care le-a permis să evalueze nivelul mental al copiilor. Materialul era compus din 30 de itemi aşezaţi într-o ordine de dificultate crescătoare pentru 3, 5, 7, 9 şi 11 ani. Acest instrument viza funcţiile mentale superioare, dar erau şi probe pentru estimarea dezvoltării senzoriomotorii. Deficienţa mentală era clasificată în trei categorii: idiot, imbecil şi debil mintal. A doua şi a treia versiune a apărut în 1908 şi 1911. În 1909, Goddard traduce a doua versiune publică în 1911, varianta americană revizuită care a fost apoi urmată de revizuire lui Kuhlman (1912) şi Terman (1916). Testul a fost tradus şi adaptat în multe ţări din Europa: în Germania de Maumann şi Bobertag, în 1914, în Italia de Saffotti, în 1911, în Belgia de Decroly şi Degaud, în 1909, în Suedia de Jaederholm, în 1914, în Marea Britanie de Burt, în 1921. Varianta scării din 1908 este normalizată pe un eşantion de 300 de copii, cu vârste de la 3 la 13 ani şi s-a introdus noţiunea de vârstă mentală. Această metodă, foarte simplă, stabileşte nivelul intelectual pentru fiecare vârstă cronologică. Seria de probe folosită constituie o scară metrică. A treia variantă a scării apare în 1911, anul morţii lui Binet. Această variantă introduce noi probe, unele pentru vârsta adultă, şi precizează tehnica de evaluare a vârstei mentale.

10

PSIHODIAGNOSTIC (I)

În 1912, Stern stabileşte formula coeficientului intelectual, prin raportarea vârstei mentale la vârsta cronologică. QI = VM/VC La sugestia lui Stern, Bobertag, utilizează primul acest procedeu de măsurare a intelectului, unde 1 reprezintă media. Dacă QI depăşeşte 1, subiectul este în avans faţă de vârsta cronologică, dacă este inferior lui 1 el este sub medie pentru vârsta sa. La această formulă se aplică înmulţirea cu 100, în revizia "Stenford", realizată de Terman (1916), luând forma QI = VM/VC × 100. În 1911, Rossolimo raportează rezultatele a 8 probe sub forma unui grafic pe care l-a numit profil. Necesitatea examinării rapide a unui mare număr de recruţi, la sfârşitul primului război mondial, a dus la realizarea a două baterii de teste colective, cunoscute sub numele de Army Alpha, în 1917 şi Army Beta, în 1918 şi a scării Pintner Paterson (1915, 1917). Problema testelor a ocupat un loc important la congresele internaţionale. Prima Conferinţă internaţională de psihotehnico a avut loc la Geneva în 1920. Tot în 1920, în Statele Unite, Woodworth introduce primul inventar de personalitate (Personal Data Sheet), pentru o utilizare individuală şi în grup. Forma finală cuprinde 116 întrebări cu alegerea răspunsurilor afirmative sau negative şi permite identificarea subiecţilor cu tulburări afective. În 1921, în Elveţia, Rorschach prezintă o nouă tehnică de diagnosticare a personalităţii prin interpretarea unor pete de cerneală. În 1922, în Franţa, prin decret se stabileşte activitatea de consilier de orientare care precede plasarea tinerilor în instituţii comerciale sau industriale prin determinarea aptitudinilor fizice, morale şi intelectuale. În acest domeniu, Strong elaborează în 1927 primul chestionar de interese profesionale. În 1927, evoluţia analizei metodologice a permis lui Thorndike să reducă în serii de patru factori aspectele măsurate ale inteligenţei (CAVD): Completare de imagini, Aritmetică, Vocabular şi Direcţionare. Mai multe activităţi mentale sunt în final grupate în trei categorii: activităţi sociale, activităţi concrete şi activităţi abstracte. Metoda centroidă, de analiză factorială a fost folosită de Thurstone (1936) şi a dus la descoperirea unor factori de grup, care nu sunt comuni pentru toate testele, ci numai unei serii de teste. În acelaşi an, Doll prezintă scala sa de maturitate socială, care contribuia la evaluarea aptitudinilor adaptative la subiecţii cu deficienţe intelectuale. La 4 iulie 1936, Comitetul Central al Partidului Comunist al fostei URSS condamnă practicarea psihotehnicii, considerată o pseudo-ştiinţă antimarxistă, ordonând distrugerea tuturor cărţilor de psihometrie. Pentru anul 1938 patru evenimente merită a fi menţionate. Bender propune o serie de nouă figuri geometrice pentru a fi copiate cu scopul realizării unor cercetări neuropsihologice şi a dezvoltării mentale. Raven publică versiunea finală a matricilor progresive care cuprind cinci serii de figuri lacunare cu ajutorul cărora poate fi măsurată inteligenţa generală, eliminând influenţa factorilor culturali. Tot acum apare prima revistă sistematică de teste psihologice numită Mental Measurements Yarbook, iar Gasell finalizează scala de teste de dezvoltare pentru copii. În 1939, David Wechsler realizează scala de diagnostic intelectual pentru adulţi., WechslerBellevue Intelligence Scale. Apoi în 1949, Wechsler Intelligence Scale for Children, iar în 1967 Wechsler Preschool and Primary Scale of Intelligence. El a făcut o bună sinteză a probelor deja

11

CORNEL HAVÂRNEANU

existente şi a prezentat rezultatele sub forma unui profil psihologic renunţând la conceptul de vârstă mentală. În 1940, Cattell, folosind analiza factorială, introduce probe neverbale foarte saturate în factorul general de inteligenţă "g", foarte puţin influenţate de factorii socio-culturali. În 1959, Guilford prezintă structura factorială a inteligenţei ca un ansamblu de abilităţi. Modelul structural al intelectului cuprinde trei dimensiuni care prin combinare formează 120 de factori. Fiecare factor este localizat la intersecţia a trei dimensiuni care-l determină. Cattell, în 1963, pe baza teoriei factoriale, elaborează teoria inteligenţei "cristalizate" şi "fluide". Inteligenţa cristalizată se manifestă atunci când sunt prezentate situaţii acumulate din mediul social, şcolar şi cultural. Testele care se referă la aceasta sunt teste de inteligenţă generală care au, mai ales, un conţinut educaţional şi şcolar. Inteligenţa fluidă este activată în situaţii noi, când subiectul trebuie să sesizeze noi relaţii dând dovadă de creativitate. Acest potenţial este măsurat prin teste prin teste care nu sunt influenţate cultural În 1968, Lord şi Novik au făcut o sinteză de interpretare a datelor obţinute pe baza testelor psihologice. Ei au dat definiţii sintactice explicite (matematice) pentru conceptele care au o semnificaţie matematică (reală). Conceptul de scor adevărat a fost definit sintactic şi interpretat semantic ca scorul observat la o persoană cu ajutorul unui test de o lungime infinită. Acesta este un scor observat aşteptat. Pe baza teoriei numerelor mari au demonstrat că definiţia teoriei testelor este o definiţie pragmatică care furnizează o interpretare semantică a scorurilor observate.

I.3. CONCLUZII Înaintea prezentării unor metode specifice de cunoaştere a persoanei, se impun câteva precizări în legătură cu posibilitatea cunoaşterii psihologice. 1. În primul rând subliniem faptul că psihologia este o ştiinţă probabilistă, iar prin cunoaşterea psihologică nu se ajunge la certitudine, ci este doar o cunoaştere probabilistică. Din această cauză în domeniul psihologic nu vom putea stabili un diagnostic definitiv, ci doar un prognostic, care va trebui să fie elaborat pe termen scurt, pentru a evita erorile predictive datorate evoluţiei în timp a subiecţilor, modificărilor, uneori spectaculoase, determinate de multitudinea şi complexitatea factorilor implicaţi în schimbare. 2. Cunoaşterea în domeniul aptitudinilor este mai avansată, precizia în măsurare fiind mult mai mare faţă de alte aspecte ale personalităţii în care nu putem fi siguri de autenticitatea reacţiilor persoanei. Când se pune problema cunoaşterii trăsăturilor de caracter, de exemplu, subiecţii activează mecanisme de apărare, etalează doar aparenţe în spatele cărora ascund trăsăturile autentice. Pentru evitarea acestor neajunsuri s-au înregistrat reacţiile subiecţilor în situaţii imaginate, pentru a releva aspecte ale personalităţii fără ca aceştia să conştientizeze scopul urmărit. În acest fel au apărut şi s-au dezvoltat testele proiective, majoritatea bazându-se pe concepţii psihanalitice. Dar, şi aceste instrumente prezintă dezavantaje, deoarece trebuie demonstrată corespondenţă dintre manifestările subiecţilor în situaţia imaginară şi cea reală, iar interpretarea presupune o teorie elaborată asupra motivaţiei şi a modului în care ea se exprimă (A. Cosmovici, 1972, 1985). 3. Există divergenţe în legătură cu metodele utilizate în psihologie, precum şi în legătură cu valoarea acestora. Fără a intra în analiza acestor puncte de vedere subliniem faptul că tendinţa unanim acceptată este de împărţire a metodelor de cunoaştere în două categorii: metode clinice (observaţia, convorbirea, 12

PSIHODIAGNOSTIC (I)

metoda biografică) şi metode psihometrice sau experimentale (experimentul, testul şi chestionarul). Diferenţa fundamentală dintre cele două categorii de metode apare în funcţie de scopul urmărit, a gradului de precizie şi obiectivitate în cunoaştere. 4. Din punct de vedere al scopului, metodele clinice îşi propun o cunoaştere cât mai amănunţită a persoanei, şi explicaţia evoluţiei sale, în timp ce metodele psihometrice se orientează spre stabilirea rangului persoanei, poziţia sa în raport cu o populaţie normală. Aceasta face ca orientarea predominantă în cazul metodelor clinice să fie cea calitativă, iar în cazul metodelor psihometrice interpretarea predominant cantitativă. 5. În legătură cu gradul de precizie şi obiectivitate, metodele psihometrice folosind verificări statistice riguroase, sunt mult mai exacte, specificându-se de fiecare dată limitele de eroare. Metodele clinice prezintă un grad de obiectivitate şi precizie mai mic, deoarece sunt lipsite de criterii precise de interpretare, această depinzând de subiectivitatea celui care face analiza. 6. În psihologia aplicată se manifestă tot mai mult tendinţa de apropiere a celor două metode, îmbinarea ambelor categorii şi evitarea unilateralităţii, care nu poate fi decât dăunătoare. Interpretarea cantitativă şi calitativă a rezultatelor obţinute prin metode psihometrice oferă atât posibilitatea ierarhizării subiecţilor în funcţie de performanţă, cât şi explicarea modului de obţinere a performanţei. Metodele clinice s-au perfecţionat, găsindu-se mijloace de standardizare a interpretărilor şi comparaţii în condiţii mai exact determinate.

13

CORNEL HAVÂRNEANU

II. MĂSURAREA ÎN PSIHOLOGIE

II.1. MĂSURAREA ŞI EVALUAREA După numeroşi autori, măsurarea este o operaţie care constă în asocierea, după anumite reguli, a unor simboluri (de cele mai multe ori numerice), obiectelor, evenimentelor, sau indivizilor, pentru a evalua gradul în care acestea prezintă anumite atribute. După realizarea acestei operaţii, putem califica aceste simboluri ca "rezultate ale măsurării." Pentru a fi semnificative, simbolurile numerice trebuie să fie însoţite de o unitate de măsură. De exemplu: În cazul unei mese cu lungimea de doi metri, vom asocia numărul 2 cu termenul "metru", care este unitatea de măsură utilizată şi care este aplicată de două ori pe lungimea mesei. Numărul 2 capătă o semnificaţie în virtutea unei relaţii cu o lungime standard care este metrul. În cazul măsurării atributelor fizice, interpretarea rezultatelor nu ridică, în mod obişnuit nici o problemă. Măsurarea atributelor psihologice, cum ar fi , raţionamentul sau motivaţia, este foarte complexă, existând foarte multe variabile care trebuie definite şi controlate pentru a obţine un rezultat valabil. De asemeni, în educaţie este dificil să găsim o unitate de măsură care să fie considerată etalon. De exemplu: Un rezultat de 40 răspunsuri corecte din 50, la o probă de randament, este dificil de interpretat, deoarece 40 de itemi corect rezolvaţi nu presupune, cu necesitate, un coeficient de dificultate egal pentru fiecare item. Deducem din definiţia precedentă că măsurarea presupune un proces de abstractizare. Dacă asociem simboluri obiectelor sau indivizilor, vom măsura, de fapt, una sau mai multe dimensiuni dintre toate cele pe care obiectele sau indivizii le posedă. De aceea este important să studiem natura acestor atribute, înainte de a realiza măsurarea. Observăm că nu toate atributele sunt în mod necesar măsurabile. Mai mult, o măsură se poate aplică mai multor atribute, nu numai unuia singur. În acest caz, posibilitatea de a izola caracteristicile atributului de măsurat este mai redusă, iar informaţiile obţinute vor fi deseori mai puţin utile. Utilizarea simbolurilor numerice presupune deci cuantificarea atributelor. Această cuantificare facilitează cunoaşterea rezultatelor relative, a gradului de prezenţă a acestora, sau manifestarea unui atribut la un individ. În acest fel obţinem rezultate foarte detaliate şi foarte precise, neinfluenţate de judecăţi personale, care ne permit să recurgem la modele de analiză matematică. Procedeele de obţinere a unei măsurări trebuie să fie explicite. Pentru aceasta există reguli precise care reglează procedeele de măsurare. Aceste reguli sunt fundamentale în construcţia şi utilizarea unui instrument de măsură, deoarece validitatea lor determină validitatea instrumentului, şi în consecinţă pe cea a rezultatelor. Nerespectarea acestor reguli duce la rezultate eronate, instabile şi chiar aberante. Acest ansamblu de reguli permite cuantificarea, fără echivoc, a atributelor unui obiect sau individ şi reprezintă o măsură legitimă.

14

PSIHODIAGNOSTIC (I)

Formularea riguroasă a regulilor care permit asocierea simbolurilor numerice unor atribute, fac ca rezultatele obţinute cu ajutorul unui instrument de măsură să fie reproductibile. Acesta este un aspect esenţial pentru standardizarea unui instrument de măsură. Un instrument de măsură este standardizat dacă toţi utilizatorii obţin rezultate similare. Această similaritate depinde de invariabilitatea conţinutului măsurat, uniformitatea procedeelor şi condiţiilor de administrare a instrumentului de măsură şi de constanţa criteriilor de corectare. Altfel spus, probele aplicate trebuie să fie tot timpul aceleaşi pentru toţi subiecţii, instrucţiunile clar enunţate, durata şi contextul administrării constant, iar criteriile de corectare invariabile şi obiective. În concluzie, măsurarea standardizată permite cuantificarea datelor, o descriere foarte obiectivă care furnizează informaţii comparabile. Cu toate că măsurarea se vrea cât mai obiectivă posibil, evaluarea presupune prezenţa unor aspecte subiective. Putem defini evaluarea ca fiind o operaţie care constă în a face o judecată de valoare, sau a acorda o valoare unui obiect sau unei persoane, comparând obiectul, l sau persoana cu un criteriu dat. Această operaţiune poate fi aplicată rezultatelor măsurării. Astfel, expresii ca "excelent", "mediocru", "superior mediei", "succes", "eşec" sunt termeni de evaluare utilizaţi în educaţie. Trebuie precizat că evaluarea unui rezultat obţinut în urma măsurării, este un aspect important când rezultatul este dificil de interpretat în absenţa unei unităţi de măsură, care poate da o semnificaţie rezultatului respectiv. Un exemplu care permite înţelegerea distincţiei dintre măsurare şi evaluare. Un prieten vă informează că bunicul său are 90 de ani. Expresia "90 de ani" sau numărul 90 este rezultatul unei măsurări. Pentru a asocia numărul 90 bunicului său, prietenul dumneavoastră a aplicat o regulă precisă care constă în a determina de câte ori o unitate de măsură este cuprinsă între două momente precise: data naşterii şi momentul în care se face relatarea. Din contra, dacă prietenul dumneavoastră vă spune că bunicul său este foarte bătrân, el vă comunică rezultatul unei evaluări. În baza acestui exemplu, putem constata că rezultatul măsurării este pur descriptiv, nici o judecată de valoare nu apare, în timp ce rezultatul evaluării este subiectiv. Acesta este unul din principiile de bază care diferenţiază măsurarea de evaluare. Se poate obiecta că această distincţie nu este foarte clară, deoarece în toată lumea se spune că un individ de 90 de ani este foarte bătrân. Avem aici o situaţie foarte frecventă din viaţa cotidiană, în care rezultatul unei măsurări se înscrie cu uşurinţă în cadrul de referinţă care corespunde experienţei anterioare. Noi cunoaştem unitatea de măsură, anii de existenţă, şi cunoaştem posibilităţile actuale ale longevităţii umane. Dintre cele două informaţii, una se referă la unitatea de măsură, iar cealaltă la posibilităţile sau limitele fenomenului studiat, care permite, foarte des, să se facă judecăţi de valoare unice pe baza rezultatelor măsurării. În acest exemplu, criteriu care a servit ca bază de evaluare este caracteristic unui ansamblu de indivizi. Este suficient ca această caracteristică să se modifice pentru ca evaluarea să fie modificată. Dacă presupunem că durata de viaţă se prelungeşte la 200 de ani, atunci judecata de valoare "foarte bătrân" nu mai este potrivită pentru o persoană de 90 de ani. Acest exemplu ilustrează foarte bine caracterul subiectiv al evaluării. În consecinţă, în educaţie şi psihologie se ignoră foarte frecvent unităţile de măsură şi limitele fenomenului studiat. Această problemă poate fi rezolvată dacă evaluăm inteligenţa unui elev, aptitudinile, interesele, calitatea randamentului său şcolar pe baza unui rezultat măsurabil. Mai mult, deseori, acest rezultat este un număr care indică cantitatea răspunsurilor bune la un ansamblu de 15

CORNEL HAVÂRNEANU

probleme puse în cadrul unui test. Rezultatul de 60 obţinut de un elev la o probă de randament nu relevă nimic din calitatea elevului şi nici din competenţa sa. Pentru a putea face o judecată de valoare, trebuie să avem acces la ambele informaţii (conţinutului probei şi posibilităţile de rezolvare a probei). Dacă cunoaştem natura problemelor pe care elevul le-a rezolvat în acea probă, vom putea deduce capacităţile sau abilităţile necesare elevului pentru a rezolva proba. Cunoaşterea naturii problemelor rezolvate sau a conţinutului probei este un compromis faţă de dificultatea de a stabili o unitate de măsură sau un standard. Din contră, dacă vom cunoaşte posibilităţile de rezolvare a probei, prin analiza rezultatelor obţinute de alţi elevi, vom putea elabora o judecată de valoare ca "excelent", "mediocru", "superior mediei" sau "normal". În acest caz evaluarea se realizează folosind un criteriu de bază şi caracteristicile unui ansamblu de elevi.

II.2. MĂSURAREA ŞI MATEMATICA O distincţie importantă între măsurare şi matematică constă în faptul că măsurarea se face pentru fapte concrete şi se aplică lumii reale. În consecinţă, deşi utilizează foarte des simboluri numerice, măsurarea este orientată tot timpul asupra faptelor empirice. Ea se raportează la lumea reală, cu scopul cuantificării atributelor unui obiect sau individ. Matematica, din contra, construieşte un sistem abstract, pur deductiv, un ansamblu de reguli care permit manipularea de simboluri şi care nu presupune în mod necesar raportarea la lumea reală. Funcţia generală a matematicii este să creeze modele utile şi comode care să permită descrierea fenomenelor naturii. Măsurarea apelează la elementele sistemului matematic pentru examinarea relaţiilor interne dintre datele obţinute printr-un procedeu de măsură şi pentru a pune în legătură relaţiile dintre rezultatele obţinute prin diferite procedee de măsurare. În acelaşi timp, nici un model matematic nu poate descrie exact şi perfect un fenomen din natură. Toate descrierile sunt aproximative, iar multe adevăruri au grade variabile. Pentru a înţelege natura măsurării, trebuie să cunoaştem proprietăţile matematice, mai precis cele ale numerelor. Din punct de vedere al măsurării, numărul este considerat ca o abstracţie simbolică a uneia sau mai multor cifre, putând servi la clasificarea sau ordonarea obiectelor, evenimentelor, indivizilor, într-o manieră sistematică, în funcţie de gradul în care acestea prezintă o caracteristică dată. Mai mult, numerele pot fi manipulate şi combinate conform unor reguli matematice dându-li-se o semnificaţie în maniere diferite şi foarte precise. Astfel, media furnizează o descriere cantitativă foarte precisă a comportamentului unui individ într-un ansamblu de situaţii. În postulatele principale ale sistemului de numere, găsim principalele postulate ale măsurării: 1. Elementele sunt fie identice, fie diferite: a = b sau a ≠ b 2. Relaţia de identitate este simetrică: dacă a = b atunci b = a 3. Relaţia de identitate este tranzitivă: dacă a = b şi b = c atunci a = c 4. Relaţia de ordine este simetrică: dacă a > b atunci b < a 5. Relaţia de ordine este tranzitivă: dacă a > b şi b > c atunci a > c 6. Elementele pot fi adunate dacă a = p şi b > 0 atunci a + b > p (adunarea cu zero lasă elementul neschimbat) 7. Adunarea este comutativă: a+b=b+a 16

PSIHODIAGNOSTIC (I)

8. Elementele identice pot fi substituite a = p şi b = q atunci a + b = p + q cu altele în adunare 9. Adunarea este asociativă: (a + b)+c = a+(b + c) Numeroşi autori recunosc şi un alt postulat al măsurării care se referă la existenţa a patru principale niveluri de măsurare corespunzătoare pentru patru tipuri fundamentale de scări de măsură care se deosebesc unele de altele prin mai multe criterii. III.3. CLASIFICAREA SCĂRILOR DE MĂSURĂ Problema clasificării scalelor de măsurare este legată de diversitatea utilizării numerelor (de exemplu numerele pot face referiri la cantităţi dar şi la calităţi). De asemeni, există tipuri distincte de scale de măsură cu care putem clasifica toate atributele măsurate. În ştiinţele umaniste, problema clasificării scalelor de măsură, este o preocupare amforă pentru numeroşi cercetători. Mulţi dintre ei consideră că pentru a înţelege precizia unei măsurări psihologice trebuie să luăm în consideraţie natura scalei utilizate în cazul unui procedeu de măsurare. Altfel spus, natura scalei de măsurare utilizată determină tipul de interpretare şi cantitatea de informaţii pe care o putem extrage din rezultatele obţinute cu ajutorul acelei scale Problema este legată de legitimitatea utilizării unor procedee matematice pentru măsurarea atributelor umane care se referă la aspecte psihologice. Primul criteriu de diferenţiere a unui tip de scară, se referă la regulile care determină modul în care numerele sunt asociate atributelor măsurate. O scală nu are raţiunea de a exista dacă nu există un izomorfism (corespondenţă) între unele proprietăţi ale atributelor măsurate şi unele proprietăţi ale seriei numerice. Proprietăţile sau natura atributelor, utilizarea procedeelor concrete care vizează măsurarea acestor atribute, sunt factori care limitează operaţiile empirice de bază aplicabile atributelor măsurate. De exemplu, unui atribut ca sexul indivizilor îi poate fi asociat un număr care are valoare de etichetă (masculin 1 şi feminin 2) În consecinţă, chiar natura atributului măsurat nu ne oferă decât posibilitatea unor operaţii empirice de clasificare şi de numărare. Un al doilea exemplu ne permite să ilustră mai bine influenţa alegerii procedeelor concrete de măsurare. Să presupunem că, fără să avem un instrument standardizat de măsurare, dorim să comparăm înălţimea unor indivizi. Operaţiile empirice aplicabile rezultatelor acestor măsurări se vor limita la a plasa, în ordine, indivizii, după talie. Însă dacă posedăm un instrument standard, care are la bază unităţi etalon, şi repetăm măsurările, numărul operaţiilor empirice aplicabile acestor rezultate va fi mult mai mare. În acest fel vom putea plasa indivizii în ordinea înălţimii, dar vom putea compara şi diferenţele dintre înălţimile lor şi chiar stabili un raport între înălţimile indivizilor. Din aceste calcule putem stabili că X este de două ori mai mare decât fiul său Y, constatare pe care nu o putem pune în evidenţă în absenţa unei unităţi etalon. Ceea ce caracterizează cel mai bine fiecare tip de scală, este studiul invarianţei. Aceasta presupune ca transformările fiecărei scale să nu producă distorsiuni ale structurii acesteia. De exemplu, dacă vrem să exprimăm datele în unităţi diferite de unităţile de măsură originale, este necesar să putem efectua această transformare, fără a modifica semnificaţia datelor. Mărimea invarianţei unei scale stabileşte limitele referitoare la transformările matematice şi statistice care pot fi legitim aplicate datelor obţinute printr-un procedeu de măsurare. În cazul scalelor prin care se stabileşte 17

CORNEL HAVÂRNEANU

rangul indivizilor, în funcţie de un atribut dat, toate transformările matematice efectuate asupra acestor date pentru modificarea rangului, falsifică rezultatele şi în consecinţă acest tip de transformare nu poate fi legitim aplicat la acest tip de scară. Fiecare tip de scară de măsurare are anumite implicaţii: În primul rând, fiecare tip de scală are anumite postulate. Dacă datele obţinute printr-un anumit procedeu de măsură sunt conforme postulatelor unui anumit tip de scală, măsurarea va fi considerată ca posedând proprietăţile inerente scalei respective. Niciodată un tip de scală nu poate face abstracţie de postulatele care îi sunt proprii. În al doilea rând, cu cât un tip e scală este mai complex, cu atât regulile care determină asocierea numerelor unor atribute măsurate sunt restrictive şi multe din informaţiile furnizate de scală sunt precise, ceea ce are efecte asupra reducerii, întinderii invarianţei scalei respective. Mai mult, postulatele matematice ale unei scale foarte complexe permit utilizare unui mare număr de operaţii matematice şi statistice. O altă proprietate majoră a unei scale este aceea de a reflecta atributele care trebuie măsurate. De exemplu, dacă dorim să măsurăm înălţimea elevilor unei clase este necesar să avem o scală care reflectă acest atribut. Se întâmplă ca multe dintre conceptele ştiinţifice, de interes pentru cercetător, să poată fi măsurate prin modalităţi rudimentare. De exemplu, să presupunem că un cercetător doreşte să obţină un singur număr care să reprezinte agresivitatea unui copil dintr-o grădiniţă. O metodă ar putea fi utilizarea interviului psihologic clinic şi apoi evaluarea subiecţilor de la 1 la 10 în acord cu mărimea agresivităţii lor. Un aspect foarte important pentru problema pusă în discuţie este ce atribute matematice generale trebuie să posede scala de agresivitate realizată pentru evaluarea copiilor de la 1 la 10. Atributele pe care trebuie să le posede o scală de măsurare sunt: magnitudinea sau mărimea, intervale egale şi punctul zero. Când o scală are magnitudine, atunci un anumit atribut poate fi judecat ca fiind mai mare decât, mai mic decât sau egal cu o altă stare a aceluiaşi atribut. Dacă revenim la exemplul anterior şi constatăm că un clinician atribuie un scor de 8 pentru subiectul X şi 5 pentru subiectul Y, această scală de măsurare reflectă diferenţele în magnitudine ale agresivităţii la cei doi subiecţi (subiectul X este mai agresiv decât subiectul Y). Intervale egale, înseamnă că magnitudinea unui atribut reprezentat de o unitate de măsură pe o scală este egală, indiferent de locul unde este plasată unitatea pe scală. De exemplu, în cazul măsurării înălţimii în cm, diferenţa între o persoană care are 160 cm faţă de alta care are 161 cm, este aceeaşi ca diferenţa care există între o persoană de 170 cm şi alta de 171 cm. Un centimetru reflectă aceeaşi cantitate (de înălţime), indiferent de locul în care este plasat centimetrul pe scală. Acest aspect nu este respectat tot timpul. Să luăm exemplul clasamentului realizat la sfârşitul unui campionat de fotbal. Diferenţa dintre echipa plasată pe locul întâi şi cea de pe locul doi este de un loc, aceeaşi diferenţă existând şi între echipa plasată pe locul doi şi cea de pe locul trei. Dar în acest caz nu putem spune că 1–2 = 2–3, aşa cum am stabilit în cazul diferenţelor de înălţime. Punctul zero absolut, este valoarea care indică faptul că atributul care trebuie măsurat nu are nici o valoare (mai bine spus are valoarea zero). Zero pentru înălţime este o valoare a scalei care presupune lipsa înălţimii. În cazul măsurării agresivităţii, cea mai mică notă pe care psihologul o poate atribui este 1. Această valoare nu indică inexistenţa tendinţei agresive. Un copil care primeşte nota 1 18

PSIHODIAGNOSTIC (I)

poate să lovească uşor un alt copil sau să-l jignească verbal, ocazional. Copilul are un nivel mic al agresivităţii, dar într-un sens relativ. Chiar dacă valoare zero ar fi o parte componentă a scalei această nu presupune inexistenţa totală a agresivităţii. Această scală de evaluare a agresivităţii nu are zero absolut.

II.4. SCALA NOMINALĂ Acest tip de scală este cunoscută şi sub denumirea de scală calitativă, scală categorială sau scală de clasificare. Forma cea mai simplă de observaţie constă în a stabili dacă două obiecte au doi indivizi sunt calitativ asemănători sau diferiţi prin răspunsurile lor la o situaţie dată, sau când prezintă una sau mai multe proprietăţi date. Vom putea astfel grupa proprietăţile sau indivizii în funcţie de una sau mai multe caracteristici comune. Este suficient să precizăm criteriile utilizate pentru includerea obiectelor sau indivizilor într-o clasă sau categorie. Apoi, după ce acest criteriu a fost stabilit şi s-a realizat repartiţia în clase, putem denumi clasa respectivă pentru a desemna obiectele sau indivizii incluşi în acea clasă. Numele clasei poate fi un număr sau un cuvânt. Ţinând seama de procedura de clasificare, rigoarea de discriminare depinde de capacitate de observaţie a evaluatorului şi de marja de imprecizie care este tolerată. În ştiinţele umane, când vorbim de egalitate dintre indivizii unei clase, vom spune că acesta este aproximativ egală în funcţie de complexitatea comportamentului uman şi de imprecizia relativă a mijloacelor de observaţie. Operaţiile de clasificare şi enumerare sunt folosite în producerea unei scale nominale. Un caz particular de clasificare este cel în care o clasă sau categorie cuprinde un singur obiect sau individ. Numele acestei clase devine o etichetă atribuită acelui obiect sau individ. În cazul în care simbolurile numerice sunt atribuite indivizilor, aceste simboluri nu reprezintă cantităţi de atribute şi nu putem vorbi de posibilităţi de utilizare a matematicii sau statisticii, ci doar de obţinerea unor informaţii calitative. Putem avea doar o corelaţie accidentală între aceste numere şi atribuitele respective, dar acesta nu poate fi obiectul unei interpretări referitoare de sensul legăturii. Singurele operaţii statistice posibile cu aceste date nominale sunt calculul frecvenţelor (numărul de cazuri din fiecare categorie), identificarea modulului (categoria cu cei mai mulţi indivizi), calcului coeficientului de contingenţă (verificare ipotezei referitoare la distribuţia cazurilor în categorii, evaluarea interdependenţei a două principii de clasare). Aceste operaţii statistice sunt realizabile şi la scalele de măsurare mai complexe. Trebuie să facem distincţia între utilizarea numerelor în scopul identificării unei clase şi utilizarea numerelor care reprezintă frecvenţa obiectelor sau indivizilor dintr-o clasă sau categorie. În primul caz, (identificarea unei clase), utilizarea numerelor nu este o măsurare ci un indiciu, la care se respectă postulatele 1, 2 şi 3. Mulţi autori consideră că scara nominală nu este decât o formă de clasare. În acelaşi timp, majoritatea autorilor consideră că operaţiile de clasare corespund criteriilor de definire a unei măsurări. Putem concluziona că scala nominală constituie un nivel de măsurare primar. Utilizarea scalelor nominale este limitată în ştiinţele umane şi nu furnizează indicaţii asupra amplitudinii atributelor.

19

CORNEL HAVÂRNEANU

Un exemplu de scală nominală este scală utilizată pentru diferenţierea tipurilor temperamentale (coleric, sanguinic, flegmatic şi melancolic). Dacă considerăm că fiecare individ poate fi plasat doar într-unul din cele patru tipuri enumerate, atunci aceste tipuri reprezintă mulţimea categoriilor sacalei nominale. Uneori, pentru ca scala să îndeplinească condiţia de exhaustivitate, se introduce şi categoria "alte situaţii", "şi alţii" etc. Pentru eficienţa cercetării această categorie specială trebuie să nu includă o parte semnificativă a populaţiei studiate, fapt care ar diminua relevanţa rezultatelor. În operaţiunea de culegere şi prelucrare a datelor, se recurge frecvent la codificarea acestora. Prin codificare se înţelege transformarea unei mulţimi de obiecte, date, itemi, dintr-o formă sistematică de prezentare într-o altă formă. De exemplu tipul coleric=1, tipul sanguinic=2, tipul flegmatic=3, iar tipul melancolic=4. Aceste coduri, utilizate în scala nominală trebuie considerate simple simboluri, proprietatea lor de a fi diferite între ele permite discriminarea categoriilor. Trebuie menţionat faptul că între categoriile unei scale nominale nu există relaţii de ierarhie, ordinea prezentării fiind indiferentă. Să presupunem că doi cercetători, în investigaţii independente, au obţinut următoarele rezultate: TIP TEMPERAMENT 1 2 3 4

NR. SUBIECŢI CERCETAREA 1

NR. SUBIECŢI CERCETAREA 2

32 58 48 73 37 80 33 39 TOTAL 150 250 Menţionăm că în coloana din stânga avem coduri, etichete lipsite de semnificaţie cantitativă în timp ce numerele din celelalte două coloane posedă această semnificaţie. Ansamblul numerelor din coloana a doua şi a treia poartă numele de distribuţie a tipurilor temperamentale în grupurile studiate. Fiecare număr reprezintă frecvenţa absolută a unei categorii din scală. Compararea rezultatelor celor două cercetări ne conduce la constatarea că a doua cercetare prezintă valori mai mari la fiecare categorie. Această constatare nu are valoare ştiinţifică deoarece al doilea grup de cercetare este mai numeros decât primul, şi este normal ca frecvenţele să fie mai mari. Pentru o comparaţie relevantă trebuie să utilizăm frecvenţele relative. Frecvenţa relativă pentru o categorie se obţine prin împărţirea frecvenţei absolute la numărul total de subiecţi. Prin înmulţirea frecvenţei relative cu 100, obţinem procente. Comparaţiile efectuate după frecvenţele relative, sau procente capătă substanţă, deoarece măsurătorile realizate pe eşantioane de mărimi diferite sunt aduse la un sistem de raportare comun, ceea ce permite comparaţii. Trebuie să se ţină seama de faptul că frecvenţele relative sunt sensibile la volumul eşantionului. Astfel, 5 cazuri din 10 reprezintă 50%, în timp ce 6 cazuri din 10 reprezintă 60% din totalul cazurilor. Diferenţa de unu între frecvenţele absolute se reflectă într-o diferenţă de 10 între procente. Dacă volumul eşantionului ar fi fost 100, atunci 5 şi respectiv 6 cazuri ar fi reprezentat 5% şi respectiv 6%. Observăm diferenţa mai mică între procentaje, datorată mărimii eşantionului. Din punct de vedere

20

PSIHODIAGNOSTIC (I)

practic, acest aspect impune raportarea numărului total de cazuri atunci când se folosesc frecvenţe relative sau procente. Operaţii asupra categoriilor unei scale nominale Asupra categoriilor unei scale nominale se pot efectua două tipuri de operaţii: gruparea (condensarea) şi rafinarea (diversificarea). Gruparea este acea operaţie prin care din două sau mai multe categorii se obţine o singură categorie care va purta o etichetă nouă, distinctă de celelalte. Prin grupare o scală nominală cu n categorii se transformă într-o scală nominală cu m categorii, unde m< n. Rafinarea este operaţia prin care dintr-o categorie se obţin două sau mai multe categorii noi, etichetate distinct. În acest fel o scală cu n categorii se transformă într-o scală cu m categorii, unde m> n. Asupra aceleaşi scale se pot efectua consecutiv ambele operaţii. Aceste operaţii corespund necesităţilor practice de analiză şi sinteză, generalizare şi particularizare etc. Aceste operaţii nu pot fi efectuate în mod arbitrar, în cazul unei scale nominale concrete, responsabilitatea transformării revenind cercetătorului, care trebuie să respecte exigenţele de conţinut şi cele formal logice. De exemplu scala nominală care cuprinde categoriile de comunicare a lui Bales, permite plasarea comunicărilor într-un grup în funcţie de rolul comunicării într-o discuţie. Clasificarea furnizează informaţii despre dinamica comunicării, raportul dintre participanţii la discuţia în grup, mecanismele discuţiei. Categoriile propuse de Bales sunt: I. 1. manifestă solidaritate 2. manifestă diminuarea tensiunii 3. manifestă acordul, acceptă pasiv 4. dă o sugestie 5. emite o opinie 6. dă o orientare, o informare 7. cere o orientare, o informare 8. cere o opinie 9. cere o sugestie 10. manifestă dezacordul 11. exteriorizează tensiune 12. manifestă antagonism Utilizând operaţiile de grupare, această scală se poate transforma, prin condensarea categoriilor, în felul următor: II. A. Reacţii pozitive (1, 2 şi 3) B. Răspunsuri aşteptate (4, 5 şi 6) C. Întrebări (7, 8 şi 9) D. Reacţii negative (10, 11 şi 12) Noua scală cuprinde 4 categorii, fiecare provenind din câte trei ale scalei iniţiale. Un alt gen de grupare ar putea fi: III. a. comunicare (6, 7) b. evaluare (5, 6) 21

CORNEL HAVÂRNEANU

c. influenţă (4, 9) d. decizie (3, 10) e. tensiune (2, 11) f. integrarea membrilor (1, 12) O altă viziune sintetică a fenomenului studiat poate produce condensări de ordinul doi, prin gruparea categoriilor din scala II: IV. i. reacţii emoţionale pozitive (A) ii. reacţii emoţionale neutre (B, C) iii. reacţii emoţionale negative (D ) Trecerea inversă, de la scale condensate la scale diversificate (cum ar fi de la scala II la scala I) se realizează prin operaţii de rafinare, şi este impusă de necesităţi analitice accentuate. Prin gruparea excesivă se produce o pierdere de informaţii primare, în timp ce rafinarea excesivă duce la o acumulare de amănunte care creează dificultăţi în perceperea esenţei problemei studiate. De aici rezultă nevoia păstrării unui echilibru între cele două situaţii. Volumul eşantionului este un element important în alegerea numărului de gradaţii pentru o scală nominală. Un eşantion mic nu se poate studia folosind o scală nominală cu un număr mare de categorii, iar un eşantion mare printr-o scală cu puţine categorii. Efectul transformării scalelor asupra distribuţiei datelor unei cercetări concrete este important. Singurul lucru constant rămâne numărul de membri ai eşantionului. Distribuţia subiecţilor pe clase se modifică la orice grupare sau rafinare a categoriilor.

II.5. SCALA ORDINALĂ Scalele ordinale sunt cunoscute şi sub numele de scale de ordine, scale de rang, scale ierarhice, şi permit ordonarea observaţiilor, indivizilor, situaţiilor de la mic la mare, de la simplu la complex, de la mai puţin la mai mult. Operaţia de enumerare şi clasare în diferite clase sau categorii este omogenă, adică toţi indivizii sau obiectele unei clase sunt considerate ca fiind echivalente, când printr-un atribut ei aparţin acelei clase. Dar, în interiorul unei clase date, indivizii pot fi comparaţi în funcţie de gradul prezenţei unui atribut comun. Trebuie să fim preocupaţi de ordinea relativă a obiectelor sau indivizilor. Realizarea acestei ierarhii se bazează pe evaluarea unui atribut observat, printr-o comparaţie directă sau indirectă. O scală poate fi obţinută, constatând că un obiect sau individ posedă atributul într-un grad mai ridicat faţă de obiectul sau individul precedent din serie, ceea ce poate fi simbolic exprimat astfel: S1 < S2 < S3.............Sn (pentru n subiecţi) Operaţiunea de ordonare presupune o discriminare foarte riguroasă faţă de simpla categorizare, deoarece pentru fiecare obiect sau individ trebuie să stabilim gradul de prezenţă a unui atribut, ceea ce nu înseamnă că scala indică cantitatea absolută a atributelor prezente, nici amploarea diferenţelor sau raporturile dintre cantităţile atributelor prezente. În alţi termeni, atributul nu se exprimă în mod necesar în unităţi egale, chiar dacă numerele care le reprezintă sunt la distanţe egale. De exemplu, un individ care se situează la rangul patru nu prezintă de două ori mai multe atribute decât cel

22

PSIHODIAGNOSTIC (I)

care se situează la rangul doi. În fine, scala ordinală nu poate exista în absenţa totală a unui atribut, ea nu admite deci zero absolut. Simbolurile numerice atribuite obiectelor sau indivizilor, sunt ranguri care indică poziţia relativă a acestora pe un continuum pentru atributul pe care dorim să-l măsurăm, ca în exemplul de mai jos. S1

S2

S3

S4

S5

S6

Observăm că într-o scală ordinală direcţia continuumului este cunoscută. Singurele informaţii cunoscute din acest continuum sunt de tipul "mai mic ca", "mai mare ca", "egal" sau "diferit" (<;>;=;≠), între indivizi sau obiecte, în funcţie de atributul măsurat. Acest continuum reprezentat mai sus ne permite să stabilim că: S1 < S2; S4 > S3; S3 ≠ S5. Datele scalelor ordinale pot fi analizate prin statistici neparametrice. Se poate recurge la toate operaţiile statistice aplicabile scalelor nominale. Pentru aceste date putem calcula mediana, centile, coeficienţi de corelaţie a rangurilor şi chi-pătrat. În acelaşi timp, operaţiile algebrice de adunare, scădere, înmulţire şi împărţire nu au nici un sens dacă sunt aplicate acestor date. Nu putem calcula media şi abaterea standard care ne oferă posibilitatea de a cunoaşte mai mult decât poziţia relativă a obiectelor sau indivizilor. Aceasta este o limită importantă a informaţiilor care pot fi furnizate de o scală ordinală, deoarece media sau abaterea standard reprezintă fundamentul metodelor statistice utilizate în ştiinţele umane. Relaţiile funcţionale stabilite pe baza scalelor ordinale ne oferă un indice, mai mult sau mai puţin satisfăcător, în comparaţie cu relaţiile exprimate de alte scale mult mai complexe. Mulţi autori consideră că scalele de măsurare psihologice furnizează informaţii despre ordinea indivizilor, în funcţie de atributul măsurat sau asupra gradului la care fiecare individ prezintă acel atribut. Aceşti autori aduc critici severe legate de utilizarea metodelor statistice puternice în analiza datelor psihologice şi recomandă o mare prudenţă în interpretarea datelor obţinute cu ajutorul scalelor ordinale. Crearea unei scale ordinale presupune, stabilirea unei relaţii de ordine între valorile posibile ale variabilei studiate. J. Piaget, de exemplu oferă modelul unei scale după criteriul slab structurat - înalt structurat, prin care evaluează stadiul dezvoltării inteligenţei la copil. Stadiul 1 exersarea reflexelor Stadiul 2 reacţia circulară primară Stadiul 3 reacţiile circulară secundare Stadiul 4 coordonarea schemelor secundare şi aplicarea la situaţii noi Stadiul 5 reacţia circulară terţiară şi descoperirea de mijloace noi prin experimentare activă Stadiul 6 inventarea unor mijloace noi de acţiune prin combinare mentală Ordinea prezentată este de la simplu la complex. Utilizând această scală putem caracteriza manifestările unui copil în funcţie de stadiul pe care l-a atins în dezvoltare. Dacă subiectul A este pasat în stadiul 1, subiectul B în stadiul 2, iar subiectul C în stadiul 3, atunci putem face afirmaţia că subiectul C are posibilităţi operatorii mai mari decât B sau C. Dar, caracteristicile scalei ordinale nu ne permit să precizăm cu exactitate cu cât este mai complex C faţă de B sau faţă de A şi nici să comparăm diferenţa dintre C şi B cu cea dintre B şi A.

23

CORNEL HAVÂRNEANU

II.6. SCALELE DE INTERVALE EGALE Aranjarea ordinală poate da rezultate foarte complete dacă cunoaştem distanţa care separă obiectele sau indivizii în funcţie de atributul măsurat. Dacă mai multe obiecte sau indivizi sunt la distanţe egale, în funcţie de gradul pe care îl prezintă atributul, distanţa care le separă poate fi considerată ca o unitate liniară de măsură şi scala constituită în acest fel se numeşte scală cu intervale egale sau scală de intervale. Egalitatea dintre intervale este necesară dacă dorim să cunoaştem diferenţele interindividuale (diferenţele dintre indivizi referitoare la un atribut, pe un singur continuum) sau diferenţele intraindividuale (diferenţele dintre poziţia unui individ în funcţie de mai multe atribute pe mai multe continuumuri). O unitate reprezintă un aspect arbitrar, dar care poate avea o relaţie cu atributul pe care dorim să-l măsurăm. Distanţele numerice egale reprezintă, în principiu distanţele empirice egale între obiecte sau indivizi, în funcţie de atribut. Se poate ajunge deseori la formularea unor enunţuri ştiinţifice în legătură cu diferenţele dintre gradele la care obiectele sau indivizii prezintă un atribut. Sensul enunţurilor formulate presupun o proprietate care se juxtapune obiectelor sau indivizilor, adică gradele de prezenţă a unui atribut pot fi supuse operaţiilor de adunare şi scădere. Dacă această proprietate este satisfăcută atunci avem o scală denumită "aditivă". Unele scale aditive oferă posibilităţi limitate de măsurare dacă zero absolut nu poate fi stabilit. De asemeni, scalele cu intervale egale permit măsurarea diferenţelor dintre gradele de prezenţă a atributelor, dar nu indică amplitudinea absolută a acestor grade, deoarece ele nu admit zero absolut. Ele presupun existenţa unui punct zero definit arbitrar. Zero nu este decât ceva arbitrar într-o scală de interval, gradul de prezenţă a unui atribut care defineşte punctul zero are puţine şanse să corespundă unei limite reale la care atributul dispare complet. Din această cauză este imposibil să stabilim proporţii pe baza gradelor de prezenţă a unui atribut exprimat pe o scală de intervale egale. În acelaşi timp, considerăm că distanţele pe o scală de intervale egale au proprietatea de adiţionare, ceea ce presupune existenţa unui zero absolut. Două enunţuri principale pot defini scalele cu intervale egale: S1 < S2 < S3.............< Sn S2 - S1 = S3 - S2 =S4 - S3.................Sn -Sn - 1 unde S1..........Sn sunt grade relative la care un atribut se prezintă pentru diferiţi subiecţi. Scala de interval ne permite să cunoaştem direcţia unui continuum, dar şi stabilirea diferenţelor între poziţiile obiectelor sau indivizilor, precum şi efectuarea unor operaţii de tipul celor prezentate mai jos. 4 1 2 3

S1

S2

S3

S4

S5

S6

S7

S8

S9

S10

S11

Acest continuum de intervale egale ne permite să stabilim că diferenţa dintre rezultatele (R) a indivizilor 1 şi 2 este mai mică decât diferenţa dintre rezultatele indivizilor 2 şi 3. Se observă că dacă diferenţa dintre rezultatele indivizilor 2 şi 3 este de 1,5 în timp ce diferenţa dintre rezultatele indivizilor 1 şi 2 sau 3 şi 4 este de 1.

24

PSIHODIAGNOSTIC (I)

Scorurile unei scale de interval nu indică amplitudinea absolută a unui atribut din cauza absenţei unui zero absolut, iar operaţiile de înmulţire şi împărţire nu au sens decât dacă ele se aplică intervalelor nu şi scorurilor. Însă operaţiile de adunare şi scădere sunt aplicabile atât intervalelor cât şi scorurilor. Scorurile dintr-o scală de intervale pot fi supuse unei transformări liniare, fără ca structura scalei să se modifice. Putem aduna sau scădea la fiecare scor o valoare constantă, sau putem împărţi sau înmulţi fiecare scor printr-o constantă, fără a afecta nici poziţia relativă a obiectelor sau indivizilor pe un continuum, nici egalitatea intervalelor, nici raporturile dintre intervale, nici forma generală a relaţiilor dintre scorurile scalei faţă de o altă scală. Scalele de intervale oferă, pe lângă posibilitatea operaţiilor statistice specifice scalelor mai puţin complexe, calculul mediei abaterii standard, coeficientul de corelaţie Pearson recurgerea la teste de semnificaţie (F; t) şi folosirea unor numeroase tehnici statistice puternice. Din acest motiv este de dorit să utilizăm scala de intervale egale în ştiinţele umane: Dar concepte ca inteligenţa, aptitudinile şi personalitatea nu pot fi măsurate decât cu scale ordinale deoarece acestea nu răspund exigenţelor scalelor de măsurare mai complexe. În consecinţă, singurele operaţii statistice acceptate legitim cu acest tip de date sunt cele specifice scalelor ordinale. Cercetarea în ştiinţele umane recurge, cu mare frecvenţă la analize statistice puternice. Această situaţie a determinat numeroase dezbateri printre cercetători purtate asupra legitimităţii de a considera atributele umane ca putând fi exprimate în unităţi egale. De fapt, înainte de a analiza rezultatele unei scale de măsurare, în conformitate cu posibilităţile pe care ni le oferă scalele de intervale, este important să stabilim empiric egalitatea intervalelor scalei respective. În cazul în care utilizăm mai multe metode de măsurare, este posibil să determinăm procedeul de operare potrivit, dacă unităţile sunt egale sau nu. Alegerea acestor operaţii se efectuează în funcţie de variabila analizată şi de concepţiile teoretice referitoare la natura variabilei respective. Diferite tehnici permit controlul dificultăţilor legate de alegerea scalei şi se va proceda într-un anumit fel dacă postulatele corespunzătoare utilizării unei scale de intervale egale sunt satisfăcute. O primă tehnică constă în utilizarea unei singure definiţii operaţionale pentru atributul măsurat. Acesta presupune să nu definim variabile decât în funcţie de rezultatele obţinute la un test. Ele reprezintă deci, în mod cert, puritate matematică, dar ele pot conduce la erori de interpretare conceptuală. O a doua tehnică constă în a transforma rezultatele brute în scoruri derivate, care sunt ele însele exprimate într-o scală de intervale egale.

II.7. SCALELE DE PROPORŢII SAU DE RAPORT Această scală, care se aplică măsurătorilor fizice este o scală numerică. În măsurarea unui atribut, zero absolut indică absenţa atributului la un obiect sau individ. O scală de proporţii poate fi stabilită pentru un atribut, care la primă vedere, nu prezintă posibilitatea absenţei totale, când putem respinge existenţa unei relaţii funcţionale între acel atribut şi un alt atribut sau fenomen care posedă proprietatea de adunare (adică zero absolut). De exemplu, dacă putem vorbi de absenţa totală a căldurii, vom putea tot timpul verifica existenţa unei relaţii funcţionale între căldură şi modificările 25

CORNEL HAVÂRNEANU

termice. Absenţa totală a variaţiilor termice corespunde unui zero absolut pentru temperatură (zero grade Kelvin). Această procedură nu se poate aplica în toate situaţiile, mai ales în cazul atributelor psihologice. Prima caracteristică a unei scale de proporţii constă în posibilitatea de a cunoaşte distanţa între zero absolut şi poziţia unui obiect sau individ pe un continuum definit pe baza unui atribut dat. Amplitudinea absolută a unei cantităţi dintr-un atribut este o dată cunoscută şi este posibil să cunoaştem poziţia unui scor individual fără a fi necesar să situam alţi indivizi sau obiecte pe acest continuum. Numerele reprezintă deci, într-o formă reală gradul prezenţei unui atribut la un individ sau la un obiect. Mai mult, ca şi pentru scalele mai puţin complexe, direcţia continuumului este cunoscută, şi de asemenea rangul indivizilor în funcţie de un anumit atribut, precum şi mărimea intervalelor dintre scoruri, intervale care sunt evident egale. Scala de raport este deci o scală care dă informaţii foarte complete. 1

0

1

2

2

3

4

4

3

5

6

7

8

9

10

Putem compara poziţiile indivizilor pe continuum dar, în acelaşi timp, putem stabili că individul 2 prezintă dublul gardului atributului prezent la individul 1, individul 3 prezintă de 3,5 ori gradul atributului individului 1, iar individul 4 prezintă de 4,5 ori gradul atributului individului 1. Dacă înmulţim sau împărţim scorurile unei scale de proporţii printr-o constantă, scala îşi conservă proprietăţile, ordinea indivizilor sau obiectelor rămân aceeaşi, proporţiile dintre intervale şi dintre scoruri rămân neschimbate, punctul zero este tot timpul prezent. Dimpotrivă, dacă adunăm sau scădem o constantă din scorurile scalei, natura scalei se modifică. Ordinea obiectelor sau indivizilor şi proporţiile dintre intervale rămân aceleaşi, dar proporţiile dintre scoruri sunt modificate, iar zero absolut dispare. Constatăm că informaţiile furnizate de o scală sunt cu atât mai precise, cu cât este mai mică libertatea de a transforma scala fără a modifica informaţiile originale. O scală ordinală, de exemplu, poate suporta toate transformările monotone fără ca informaţiile primare să fie modificate. La o scală de intervale posibilităţile de transformare sunt mult mai restrânse. În sfârşit la scalele de proporţii transformările permise sunt limitate la înmulţirea şi împărţirea printr-o constantă dacă dorim ca informaţiile să rămână identice. Postulatele unui model de scală de proporţii permit utilizarea tuturor operaţiilor aritmetice (+, –, ×, ÷), atât cu intervalele cât şi cu scorurile. Posibilitatea utilizării celor patru operaţii autorizează folosirea metodelor de analiză matematică şi statistică foarte puternice, incluzând faţă de operaţiile permise de scalele mai puţin complexe şi calculul coeficientului de variaţie. Dacă corectăm un test şi adunăm numărul itemilor rezolvaţi corect, obţinem un număr situat pe o scală de proporţii. Dar, dacă utilizăm acest număr pentru a indica poziţia subiectului pe o scală care măsoară un atribut psihologic, atunci acest număr nu poate fi interpretat pe baza regulilor unei scale de proporţii. Astfel, inexistenţa unor răspunsuri corecte (ceea ce însemnă zero răspunsuri corecte) nu 26

PSIHODIAGNOSTIC (I)

corespunde absenţei totale a atributului psihologic măsurat. De exemplu un scor zero la un test de randament lexical nu implică că abilităţile de lectură sunt nule. Mai mult, 50 de itemi corect rezolvaţi, dintr-un test, nu corespunde dublului gradului unui atribut pentru care s-au rezolvat 25 de itemi din acelaşi test. Noi nu putem spune că un subiect care are un QI de 130 are o inteligenţă dublă faţă de un subiect care are un QI de 65. De asemeni, nu putem vorbi de un QI nul, deoarece zaro absolut nu există în măsurarea atributelor psihologice. Atributele psihologice nu permit aplicarea procedeului de stabilire a unei relaţii funcţionale între două atribute deoarece acestea nu prezintă posibilitatea absenţei totale. Scalele de proporţie nu sunt convenabile măsurării atributelor psihologice.

II.8. CLASIFICAREA DATELOR OBŢINUTE PRIN MĂSURARE Observaţiile obţinute printr-un procedeu de măsură pot fi fie constante ale unui individ sau altul, sau a unor situaţii diferite pentru acelaşi individ, fie variabile. Variabilele sunt cantităţi de un anumit tip care pot lua mai mult decât o singură valoare. Acestea pot fi neordonate (exemplu: sexul) sau ordonate (exemplu: aşezarea în ordine a scorurilor obţinute la un test de randament). Variabilele ordonate pot fi negraduate (exemplu: bun, rău, slab) sau graduate (exprimate cu ajutorul scorurilor numerice). Variabilele graduate pot fi continue (există posibilitatea de a lua toate valorile numerice inclusiv fracţii, de exemplu: temperatura, greutatea) sau discrete (scorurile nu pot avea decât valori întregi, de exemplu: numărul de indivizi dintr-o categorie sau numărul copiilor dintr-o familie). Variabilele dihotomice sunt cele care nu pot lua decât două valori, de exemplu 0 sau 1. Acestea sunt cazuri particulare ale variabililor discrete. Constanta este o cantitate a cărei valoare rămâne neschimbată indiferent de context. II.9. MĂSURAREA ŞI STATISTICILE Termenul de statistică este frecvent utilizat dar este util să stabilim câteva distincţii în legătură cu folosirea acestuia în teoria psihometrică. Distingem o diferenţiere între statistica inferenţială şi cea descriptivă. Prima vizează producerea unor enunţuri probabiliste în legătură cu valorile obţinute de subiecţii unor eşantioane din populaţie. A doua se limitează la descrierea diverselor aspecte ale unui ansamblu de date empirice. Analizele matematice referitoare la măsurarea tendinţei centrale, a dispersiei sau a corelaţiilor pot duce la descrierea unui ansamblu de date empirice ale unui eşantion mai mare sau mai mic. Într-o etapă ulterioară putem aplica acestor date descriptive un ansamblu de tehnici statistice inferenţiale (calcului intervalului de confidenţă, teste de semnificaţie) care permit extinderea datelor obţinute prin investigarea eşantionului la ansamblul populaţiei studiate. În psihologie, problema eşantionării se referă pe de o parte la eşantionarea subiecţilor dar pe de altă parte la eşantionarea conţinutului (a itemilor unui test). Trebuie să facem distincţie între aceste două forme de eşantionare. Putem concepe un ansamblu de itemi a unui test ca un eşantion a unei populaţii ipotetic infinite de itemi (universul itemilor) care măsoară aceeaşi trăsătură. Teoria măsurării este preocupată de relaţiilor statistice între scorurile obţinute la test şi scorurile ipotetice adică, scorurile care ar putea fi obţinute dacă toţi itemii din universul de itemi ar fi utilizaţi pentru testare. După ce un instrument de măsură a fost construit şi când el face obiectul unor cercetări empirice, este important să

27

CORNEL HAVÂRNEANU

realizăm analize statistice (inferenţiale) pentru generalizarea datelor obţinute pe eşantioane de subiecţi, la populaţia corespunzătoare. În construcţia unui instrument preocuparea principală este examinarea posibilităţilor de extindere la populaţia de itemi a rezultatelor obţinute cu ajutorul eşantionului de itemi. În consecinţă, este imposibil să ţinem seama în acelaşi timp, în analize statistice, de cele două aspecte ale eşantionului. O manieră tipică de rezolvare practică a acestei probleme este de a ţine seama, în mod explicit, de unul din cele două dimensiuni şi considerând că cealaltă dimensiune poate eventual să influenţeze rezultatele. Există posibilitatea să se rezolve această problemă într-o manieră mult mai sigură. Putem folosi un eşantion foarte mare, fără a fi preocupaţi de erorile de eşantionare decât în raport cu celălalt eşantion. În psihometrie când construim un instrument de măsură utilizăm un eşantion de subiecţi suficient de mare pentru ca eroare de eşantionare referitoare la indivizi să fie puţin importantă. Problema reprezentativităţii eşantionului de subiecţi fiind rezolvată, reprezentativitatea eşantionului conţinutului va deveni preocuparea centrală. Un eşantion de subiecţi relativ restrâns nu este suficient pentru un studiu de validitate pentru noul instrument. Mai mult, dacă eşantionul de subiecţi este suficient de mare, atunci precizia testului va fi independentă de numărul de subiecţi din eşantion şi va fi legată direct de conţinutul testului adică de numărul de itemi. II.10. CUNOAŞTEREA PERSOANEI ŞI ASPECTELE MĂSURĂRII În ştiinţele umane măsura nu se aplică direct indivizilor ci, diferitelor caracteristici ale acestora la care se face referire printr-o terminologie variată. Când vorbim de atribut, de proprietăţi sau de trăsătură, facem referire la o particularitate care este prezentă şi se manifestă în diferite grade la indivizii unei clase date, acestea nefiind în mod necesar prezente la toţi indivizii. Problema este de a cunoaşte dacă un individ posedă unele proprietăţi. În cazul unei proprietăţi care se referă la abilitatea unui individ sau la personalitatea sa, măsurarea se referă la comportamentele observabile şi măsurabile. Această proprietate este o construcţie, un concept care se referă la un aspect precis al individului şi din care putem extrage un ansamblu de comportamente, pe care îi vom considera indicatori ai proprietăţii respective. Acest concept căruia îi atribuim un nume (perseverenţă, inteligenţă, autoritarism etc.) nu există în afara indivizilor. Pentru a fi raţional este necesară o coerenţă cu acele comportamentele observate, cu organizarea şi structurarea lor. Pe baza observaţiilor indicatorilor unei proprietăţi a trăsăturii vom putea presupune prezenţa, într-o măsură mai mare sau mai mică a proprietăţii, la un individ iar această presupunere implică formularea unuia sau mai multor postulate sau o demonstraţie pentru stabilirea unei relaţii între proprietăţi şi manifestările sale (indicatori comportamentali). Un concept poate fi definit în două feluri, fie cu ajutorul altor concepte (definiţie teoretică sau constitutivă) fie cu ajutorul procedeelor experimentale (definiţie empirică sau operaţională). Dacă unele trăsături se pretează la definiţii relativ clare şi precise (aptitudine numerică, aptitudine verbală etc.) altele sunt foarte ambigue şi mai imprecise (onestitate, impulsivitate etc.). În cazul în care presupunem că o proprietate poate fi măsurată cu ajutorul unor indicatori, atunci proprietatea respectivă face obiectul unei definiţii operaţionale riguroase în care trebuie precizate activităţile şi operaţiile la care se recurge pentru a putea fi supuse procedeului de măsurare. 28

PSIHODIAGNOSTIC (I)

Cercetătorii caută în mod obişnuit izolarea unei proprietăţi. În acest fel ei limitează observaţiile directe şi indicatorii la categoria de comportamente pertinente studiului lor, pentru a stabili indicatorii proprietăţii. Valoarea inferenţei prin utilizarea unui procedeu de măsurare este dependent de natura observaţiilor, care sunt în funcţie de interacţiunea anumitor factori. Caracteristice naturale ale proprietăţii, teoria care o susţine, natura instrumentelor de măsură, şi experienţa cercetătorului sunt factori care determină tipul de observaţie (direct sau indirect) şi în acelaşi timp veridicitatea cazurilor observate. Dar ştiinţa vizează stabilirea consensurilor propriilor enunţuri referitoare la conceptele pe care le dezvoltă şi este important ca observaţiile să poată fi reproduse. Din acest motiv condiţiile observaţiilor, timpul, locul şi circumstanţele trebuie precizate. De asemenea, procedeul de măsurare trebuie să poată fi refolosit şi rezultatele să fie verificabile. Mai mult, valoarea observaţiilor în ştiinţele umane, este limitată de diferite surse de eroare, rezultatele măsurării fiind doar estimări ale indicatorilor proprietăţii studiate. Precizia rezultatelor permite evaluarea valorilor observate, a intervalelor “de confidenţă” în interiorul cărora valorile studiate au o probabilitate dată. Pentru a elimina lacunele observaţiilor trebuie să elaborăm un instrument de măsură care să permită evaluări cât mai precise ale indicatorilor. Elaborarea acestor instrumente presupune o bună înţelegere a conceptelor. Primele baze de identificare a unei proprietăţi pot fi imperfecte datorită limitelor observatorului şi a conceptelor eronate despre proprietatea respectivă. În cursul elaborării unei măsurări numeroase schimbări sunt făcute asupra conceptelor legate de proprietatea măsurată. Primele estimări sunt grosiere şi posedă multe erori. Cercetătorul poate perfecţiona scala de măsurare prin determinarea relaţiei existente între proprietatea măsurată cu ajutorul scalei şi alte proprietăţi. În acest fel, măsurarea devine mai rafinată dacă în timp se achiziţionează noi cunoştinţe. Realizarea unor instrumente la care erorile de măsurare să fie cât mai mici şi care să permită înregistrarea cât mai obiectivă a manifestărilor unei proprietăţi este mai mică în domeniul psihologiei. De fapt, constatăm că nici măsurătorile fizice nu sunt perfecte. Simplul fapt de a face o măsurare, în care intervine un observator şi folosirea unui instrument de măsură afectează rezultatele. Dacă metodele respective permit eliminarea, într-o măsură mai mare sau mai mică, a efectelor procedeului de măsurare, rămâne tot timpul o interacţiune nedeterminată între subiect şi observator. Faptul că măsurarea presupune o eroare afectează certitudinea în stabilirea unei relaţii cauzale. Concepţiile moderne de măsurare substituie modelului convenţional “cauză - efect”, enunţuri relative asupra probabilităţii de manifestare a unui eveniment sau interacţiunilor dintre observaţii. În statistică, proprietatea este măsurată în funcţie de acumularea unor evenimente (media) şi variaţia acestora (varianţă).

29

CORNEL HAVÂRNEANU

III. METODA TESTELOR

III.1. CONDUITA CA RELAŢIE Faptul psihologic este o conduită, care implică o schemă de relaţii, pe care le studiază psihologul. Conduita este manifestarea unei persoane într-o situaţie dată. Dacă notăm conduita cu R (fideli tradiţiei anglo - saxone, unde R reprezintă iniţiala de la răspuns sau reacţie), atunci aceasta depinde de personalitatea subiectului (P), care se confruntă cu o situaţie dată (S). În acest fel putem considera conduita în funcţie de personalitate şi situaţie: R=f(P,S). În evoluţia psihologiei această relaţie a cunoscut diferite forme în funcţie de paradigmele explicative la care au aderat cercetătorii. Watson (1913), a pus bazele paradigmei behavioriste, în centrul atenţiei fiind plasat studiul comportamentului exterior. Pentru acesta relaţia era de tipul R=f(S), aspectele legate de personalitatea subiecţilor au fost neglijate deoarece psihologul nu poate pătrunde în interiorul "cutiei negre". Woodworth (1929), complică schema de relaţii, sub forma S ⇒ O ⇒ R, scoţând în evidenţă rolul organismului, dar se limitează doar la evocarea determinanţilor biologici ai comportamentului. Pentru a evita orice confuzie trebuie menţionat faptul că variabilele S, R, P pot fi studiate la diferite niveluri: Conduita (R), reprezintă actul subiectului şi are componente endocrine, neurovegetative, motorii, verbale. Psihologul se poate limita la studii fragmentare, luând în consideraţie doar o componentă, dar poate cerceta şi relaţiile dintre mai multe componente. Astfel, o conduită manifestată printr-un răspuns verbal, pate fi analizată din punct de vedere a structurii gramaticale, a naturii fonemelor, a semnificaţiei sau a efectului produs pentru interlocutor. Situaţia (S), pate fi de asemenea analizată la diferite niveluri. Stimulii fizici, care provin de la diferite surse, acţionează de multe ori asupra subiecţilor, fără ca aceştia să conştientizeze. Lumina, temperatura, umiditatea, presiunea atmosferică, compoziţia şi gradul de ionizare a aerului influenţează dispoziţiile şi activităţile oamenilor. Percepţiile nu sunt simple fotografii ale obiectelor, ele sunt construcţii ale experienţei, sunt influenţate de modul în care subiectul se raportează la situaţie, de atitudinea acestuia. Situaţia este deci, relativă la subiect şi este important modul în care subiectul vede situaţia, în funcţie de personalitatea sa. Din aceste considerente relaţia nu este de tipul R=f(S,P) ci, R=f(S ⇔ P), săgeata dublă indicând că există întotdeauna o interacţiune între S şi P, care nu sunt simple variabile aditive. Această interacţiune poate fi cunoscută prin interpretarea răspunsurilor subiectului, care va dezvălui semnificaţia pe care acesta o dă situaţiei. Personalitatea (P), este o sinteză dinamică de aspecte morfologice şi fiziologice, dar şi conative, afective, volitive. Cercetătorul trebuie să ţină seama de aceste aspecte şi chiar să ia în 30

PSIHODIAGNOSTIC (I)

consideraţie şi alte variabile ca: vârsta, sexul, integritatea senzorială, temperamentul, educaţia primită, motivaţia etc. Personalitatea este în centrul relaţie, ea nu poate fi izolată din relaţie deoarece se manifestă ca un nod de relaţii între situaţii şi răspunsuri. III.2. TIPURI DE RELAŢII ÎNTRE S - P - R Există trei modalităţi clasice de abordare a acestor relaţii: a. Relaţii funcţionale, utilizate pentru studiul funcţiilor psihice, unde aceeaşi persoană reacţionează diferit la variabile cantitative şi calitative ale situaţiei.

S1

R1

S2

R2

S3

P

R3

Rn

Sn

În această figură S1, S2, S3, .....Sn, reprezintă situaţii cărora le corespund diferite răspunsuri R1, R2, R3, ...Rn. De exemplu, evoluţia adaptării la întuneric (R) este în funcţie de timp (S), sau volumul materialului memorat (R) este în funcţie de numărul de repetiţii, sau reacţiile defensive (R) sunt în funcţie de gradele diferite ale frustrării (S). b. Relaţii structurale, folosite pentru studiul structurii psihice, unde se studiază relaţiile dintre răspunsurile obţinute de subiecţi pornind de la situaţii diferite.

S1

R1

S2

R2

S3

Sn

P

R3

Rn

În acest caz, situaţiilor diferite S1, S2, S3, .....Sn, le corespund răspunsuri diferite R1, R2, R3, ...Rn. Aici se pune problema de a stabili relaţiile dintre răspunsurile R1, R2, R3, ...Rn, care sunt dependente de structura personalităţii. Aceste studii utilizează calcule de corelaţie şi analiza factorială. Astfel se pot studia relaţiile dintre reacţiile obţinute în diferite situaţii care produc emoţii sau relaţiile dintre diferite niveluri de eficienţă în sarcini diferite. Logica acestor studii se bazează pe faptul că dacă obţinem corelaţii ridicate între răspunsurile subiecţilor la diferite situaţii, înseamnă că există un factor, în structura personalităţii care justifică aceste corelaţii. În acest fel Spearman a obţinut un factor "g" de 31

CORNEL HAVÂRNEANU

inteligenţă generală şi mai mulţi factori "s", consideraţi factori specifici, iar Thurstone mai mulţi factori de grup, printre care factorul numeric "N", factorul de fluiditate verbală "W", factorul de comprehensiune verbală "V", un factor perceptiv "P", unul de raţionament "R" (cu două forme raţionament inductiv I şi deductiv D). c. Relaţii diferenţiale, folosite pentru studierea diferenţelor dintre indivizi, unde luăm în consideraţie reacţiile unor persoane diferite la o singură situaţie standardizată.

S

P1

R1

P2

R2

P3

R3

Pn

Rn

Diferenţele dintre R1, R2, R3,...Rn, se obţin datorită diferenţelor existente între P1, P2, P3,...Pn. În acest fel putem studia diferenţele dintre indivizi, dar putem compara şi reacţiile unor grupuri diferite, în funcţie de anumite caracteristici ca: vârsta, sexul, etnia, nivelul cultural etc. În cel de al doilea caz putem pune în evidenţă unele aspecte ale personalităţii, comune în diferite grade, tuturor subiecţilor care aparţin unui grup selectat pe baza unor criterii dinainte stabilite. De exemplu, putem studia variaţiile eficienţei subiecţilor în diferite domenii de activitate în funcţie de experienţa profesională a acestora, evoluţia percepţiilor în funcţie de vârstă şi sex, asemănările şi deosebirile de mimică emotivă la populaţii care aparţin unor culturi diferite. Acest tip de relaţie este folosit atât în cazul experimentului cât şi în cel al testului psihologic, dar cele două aspecte nu sunt identice. În situaţia experimentală, P1, P2, P3, ...Pn, este aceiaşi persoană în stări diferite. Situaţiile interne, subiective pot fi diferite. De asemeni dacă sunt ingerate anumite substanţe (stimulatoare, deprimante, droguri), reacţiile sunt determinate de acestea. În cazul testului P1, P2, P3, ...Pn, sunt persoane diferite. Din aceasta cauză nu mai avem aceeaşi certitudine în stabilirea relaţiilor dintre fapte şi nici atunci când interpretăm rezultatele, deoarece situaţia este interpretată diferit de fiecare persoană. În cadrul relaţiilor S ⇔ P, necunoscând perfect persoana nu putem şti care din factorii care acţionează asupra lui P1 determină R1 şi care din factorii care acţionează asupra lui P2 determină R2. Dacă R1 şi R2 pot fi răspunsuri aproape identice P1 şi P2 sunt subiecţi foarte diferiţi. În concluzie, între experiment şi test există o deosebire de precizie, testul fiind mai puţin precis decât experimentul. Totuşi, testul rămâne o formă de experiment, pentru că provocăm o reacţie în condiţii bine determinate ţi obţinem reacţii în aceste condiţii. Şi în cazul experimentului, chiar dacă aceste se adresează aceloraşi subiecţi, starea acestora se poate modifica, subiecţii îşi pot schimba atitudinea şi pot interveni factori care ne scapă de sub control. Pentru a evita erorile, în cazul experimentului vom folosi grupe de subiecţi, şi în acest fel vom putea verifica dacă rezultatele sunt datorate stimulului şi nu subiectivităţii subiecţilor. Condiţia care se impune pentru precizie, este ca subiecţii să fie echivalenţi.

32

PSIHODIAGNOSTIC (I)

III.3. DEFINIREA TESTELOR Termenul a fost introdus în psihologie de James McKeen Cattell, psiholog american, elev a lui Wundtt, care în 1890 denumeşte probele destinate cunoaşterii deosebirilor dintre indivizi "teste", denumire care s-a păstrat şi astăzi (în engleză "test" înseamnă probă, încercare, experimentare). Lee Cronbach, defineşte testul ca un "procedeu sistematizat de măsură a comportamentului unor persoane şi de descriere a acestuia cu ajutorul unor scări numerice sau a unui sistem de categorii", (scări nominale sau ordinale). Pe baza acestei definiţii testul cuprinde chestionarele, procedee pentru observarea comportamentului social, aparate pentru măsurarea şi înregistrarea randamentului. Pentru André Rey, "testul este un mijloc de a diferenţia indivizii în funcţie de un etalon", iar Anne Anastasi (1976) consideră că "un test psihologic este măsurarea standardizată şi obiectivă a unei modalităţi de comportament". Asociaţia internaţională de psihotehnică şi Henri Piéron (1963) definesc testul "o probă determinată, implicând o sarcină de executat, identică pentru toţi subiecţii examinaţi. Este o tehnică precisă pentru aprecierea succesului sau pentru notarea numerică a reuşitei". Definiţia scoate în evidenţă două aspecte importante: folosirea unei probe standardizate şi a unei tehnici exacte de apreciere a rezultatelor. P. Pichot observă că aceste definiţii elimină o categorie importantă de "teste" şi anume "testele" proiective. După el, "testul psihologic este o situaţie standardizată servind drept stimul unui comportament. Acest comportament este evaluat şi comparat statistic cu cel al altor indivizi plasaţi în aceeaşi situaţie, ceea ce permite clasarea subiectului fie cantitativ, fie tipologic". În legătură cu "testele" proiective", în literatura de specialitate se întâlneşte termenul de "tehnică proiectivă", deoarece aceste "teste" nu sunt suficient de standardizate, mai ales în privinţa aprecierii şi interpretării rezultatelor. Acesta este motivul care justifică eliminarea acestora din categoria testelor şi folosirea termenului de tehnică, tocmai pentru a evidenţia specificul lor. Ion Holban (1978), defineşte testul ca "instrument al metodei experimentale, organizat sub forma unei probe standardizate din punct de vedere al conţinutului, al condiţiilor de aplicare şi al modalităţilor de apreciere a rezultatelor, instrument ce este folosit în stabilirea unei anumite variabile". Autorul face câteva observaţii importante referitoare la specificul acestor instrumente de cunoaştere. Testul impune existenţa unei relaţii directe şi specializate între itemii testului şi variabilele de investigat. Orice test are valoare numai în limitele diagnosticului variabilei pentru care a fost elaborat. Această relaţie nu este şi inversă, adică pentru aceeaşi variabilă putem găsi un număr considerabil de teste, mai mult sau mai puţin apropiate ca structură. De exemplu, multe teste de inteligenţă au fost construite după principiile şi modelul testului elaborat de Binet, cărora li s-a schimbat, după caz, diferite categorii de itemi. Andrei Cosmovici, (1996), defineşte testul ca "o probă standardizată, vizând determinarea cât mai exactă a gradului de dezvoltare a unei însuşiri psihice sau fizice." Observăm, şi în acest caz accentul care se pune în legătură cu standardizarea, dar şi determinarea cu ajutorul testelor o performanţelor de care sunt capabile unele persoane datorită calităţilor fizice pe care le posedă. În psihologie, termenul "test" are două sensuri:

33

CORNEL HAVÂRNEANU

a. Este o probă standardizată din punct de vedere al consemnului (explicarea sarcinilor de efectuat) şi a modului de corectare, cotare şi interpretare a rezultatelor, acestea fiind fixate dinainte pentru a evita eventualele variaţii care se pot datora persoanei care aplică, corectează şi interpretează testul. b. Este o micro-situaţie, o simulare a unor caracteristici bine definite, în care vom plasa o persoană cu scopul de a studia modul în care aceasta procedează în raport cu situaţia. Micro-situaţia reprodusă trebuie să fie cât mai apropiată de situaţia reală din care a fost extrasă. Roger Mucchielli (1969), consideră că un simulator este "un dispozitiv care reproduce, dup reguli şi garanţii bine precizate un ansamblu de condiţii reale ale existenţei". Alţi autori, printre care Sorokin, Whyte (adversari ai metodei testelor), susţin că singura probă valabilă este realitatea muncii, dacă vrem să judecăm capacităţile unui subiect. Dar ei nu amintesc de faptul că această manieră de confruntare cu realitatea muncii este o problemă foarte dificilă, care presupune consumuri considerabile de timp şi material, iar evaluarea rezultatelor cere observaţii de lungă durată. Acestea sunt motivele care justifică utilitatea folosirii unor micro - situaţii. În acest fel, cu ajutorul testului se va extrage dintr-o situaţie concretă, reală un eşantion de condiţii sau factori, consideraţi semnificativi pentru un anumit tip de comportament, ignorând aspectele neesenţiale. X1 X5 Xm-1

X2 X3 X6 X7

X4 X8

Xm

SITUAŢIA CONCRETĂ

Y1 Yn-1

Y2

Y3 Yn

SITUAŢIA TEST

De exemplu, dacă vrem să cunoaştem capacitatea de abstractizare a unui subiect, atunci în vom cere să rezolve o serie reprezentativă de sarcini de abstractizare, urmărind să extragem cât mai multe eşantioane de conduită reprezentative pentru operaţia de abstractizare. Răspunsurile subiectului vor avea valoare diagnostică dacă există o legătură reală între răspunsurile acestuia în situaţia experimentală (rezultatele la test) şi conduita subiectului în situaţii concrete de viaţă. Dacă constatăm o strânsă legătură între performanţa obţinută în rezolvarea sarcinilor la test şi capacitatea reală de abstractizare a subiectului, atunci putem trage concluzia că testul are utilitate practică. Constatăm că testul este o situaţie experimentală controlată, variabilele lui esenţiale trebuie să fie dinainte cunoscute de examinator. Prin natura sa, testul tinde să reproducă, în condiţii artificiale, condiţiile unei situaţii reale. În acest fel el devine o micro-situaţie tipică, simulată. Valoarea "simulatoare" a testului va depinde de analiza situaţiei reale, de definirea variabilelor situaţiei reale şi a modului de interacţiune a acestor variabile. Aceasta implică, cunoaşterea structurii funcţionale a situaţiei şi reproducerea, sub forma unui test a conţinutului psihologic a structurii funcţionale a situaţiei identificate. Testul nu trebuie să piardă din vedere nici o variabilă esenţială a situaţiei concrete. În acest caz testul nu este nici analitic, nici sintetic, ci analog cu situaţia reală, în sensul că modelează conţinutul psihologic al activităţii reale, dar nu şi forma exterioară a acesteia.

34

PSIHODIAGNOSTIC (I)

În concluzie, deosebirile exterioare, de formă, între sarcina test şi sarcina reală, ascund mereu o identitate internă, de conţinut sau de natură psihologică. Modalitatea de rezolvare a acestei probleme este fundamentală pentru valoarea constructivă şi diagnostică a unui test (Roger Mucchielli, 1969). Pentru a evita unele confuzii, este necesar să facem distincţia dintre teste şi chestionare. Reprezentanţii şcolii germane definesc chestionarele ca fiind "teste subiective". Această atitudine este justificată de faptul că precizia chestionarelor este mult mai mică, din cel puţin două motive. În primul rând, răspunsurile obţinute cu ajutorul acestor instrumente sunt dezirabile, subiecţii au tendinţa de a face o bună impresie, de a răspunde aşa cum cred ei că este bine şi nu aşa cum sunt în realitate. În al doilea rând, bazându-se pe introspecţie (care este de fapt o retrospecţie), intervine uitarea, ceea ce face ca multe aspecte esenţiale să fie neglijate. Prin utilizarea testelor aceste limite sunt înlăturate, acesta fiind un instrument mult mai precis. Distincţia esenţial - neesenţial este mai tranşantă în cazul testelor şi dispare posibilitatea de a măsura aparenţele. Diferenţierile dintre persoane, evidenţiate cu ajutorul testelor, sunt esenţiale dacă demonstrăm constanţa acestora. Testul este un instrument valoros dacă predicţia pe care o facem cu ajutorul lui este pertinentă, adică dacă se referă la comportamente care persistă la un individ.

III.4. CLASIFICAREA TESTELOR Testele ca mijloace de psihodiagnostic s-au dezvoltat într-un ritm accelerat, utilizându-se în prezent, în practica psihologică peste 10.000 de teste, astfel încât este dificilă realizarea unei clasificări care să surprindă cele mai sensibile diferenţe pe baza criteriilor care se iau în consideraţie pentru o clasificare generală. Există în literatura psihologică numeroase clasificări ale testelor: După paradigma teoretică la care aderă: reprezentanţii şcolii experimentaliste, care descompun personalitatea în părţi componente, apelează la teste "sectoriale" folosind analiza factorială şi metode metrice precise, în timp ce psihologii clinicieni, încearcă să cuprindă ansamblul personalităţii cu ajutorul testelor holistice, folosind sau nu indicatori numerici. După aspectul psihologic investigat: găsim teste intelectuale, care vizează cunoaşterea proceselor cognitive (percepţie, memorie, capacitate de analiză şi sinteză etc.), teste de personalitate, care vizează aspectul afectiv - atitudinal. Această clasificare grupează pe de o parte testele intelectuale, care sunt metrice, iar pe de altă parte testele de personalitate, care sunt analitice (chestionarele) sau holistice (testele proiective). După modul de prezentare: testele pot fi orale, răspunsul subiectului se dă sub formă verbală, teste scrise (numite creion - hârtie), teste instrumentale, la care se utilizează un suport concret (material sau un aparat), teste informatizate, aplicate cu ajutorul computerului. După modul de aplicare: teste individuale şi teste de grup. După timpul alocat pentru răspuns: teste cu timp liber şi teste cu timp limitat. După scopul urmărit (P. Pichot) distinge: teste de eficienţă, care măsoară o aptitudine sau o capacitate, şi teste de personalitate prin care se urmăreşte explorarea fondului psihologic intim, determinarea aspectelor motivaţionale, ale caracterului accentul fiind pus pe interpretarea calitativă a datelor obţinute.

35

CORNEL HAVÂRNEANU

O clasificare în detaliu a testelor psihologice este utilă şi eficientă din punct de vedere practic. În acest fel putem distinge următoarele categorii de teste: • teste de inteligenţă şi dezvoltare mintală, care măsoară aptitudinea cognitivă generală şi nivelul atins în dezvoltarea caracteristicilor intelectuale; • teste de aptitudini şi capacităţi, care au fost elaborate pentru măsurarea aptitudinilor de grup şi specifice; • teste de personalitate, care măsoară însuşiri de temperament şi caracter, acestea fiind împărţite în două categorii: 1. teste obiective de personalitate, care-şi propun obţinerea unor date cuantificabile, cât mai puţin influenţate de interpretările subiective şi evitarea tendinţei de faţadă a subiecţilor în momentul elaborării răspunsului, deoarece aceştia nu conştientizează aspectele personalităţii vizate de test; 2. tehnici proiective, care valorizează mecanismul de proiecţie în cunoaşterea psihologică a persoanei, trecând peste vigilenţa conştiinţei în încercarea de a studia inconştientul; • teste de cunoştinţe sau docimologice, care măsoară nivelul cunoştinţelor acumulate de subiecţi şi servesc ca modalitate de examinare şi notare.

36

PSIHODIAGNOSTIC (I)

IV. FIDELITATEA TESTELOR

Valoarea oricărui instrument de cunoaştere psihologică depinde de calităţile acestuia. R. Zazzo în prefaţa la "Manuell pour l'examen psychologique de l'enfant" (1969) face câteva reflecţii asupra metodei testelor din care cităm: "Practicarea metodei testelor ridică o mulţime de probleme, unele create cu totul de prejudecăţile şi ignoranţa unor oameni care vorbesc despre asta fără să ştie mare lucru, altele într-adevăr reale, întâlnite şi rezolvate de bine de rău de către cei care construiesc testele şi le utilizează... Un test nu este, de fapt, aşa cum cred adesea profanii, un dispozitiv misterios care ne informează în mod automat şi infailibil despre facultăţile misterioase al căror nume scapă psihologiei comune. Se confundă standardizarea probei cu un pretins automatism de aplicare. Se confundă, de asemenea, natura insolită a anumitor factori la care încearcă să ajungă testele cu natura însăşi a metodei: ca şi cum in test de ortografie nu ar indica natura acestei metode la fel de clar ca un test al factorului G, de exemplu. Se confundă, în sfârşit, precizia măsurărilor obţinute cu o afirmare a fixităţii pentru lucrul măsurat: ca şi cum temperatura citită astăzi pe n termometru ar fixa febra la un nivel definitiv." Vom sublinia faptul că orice instrument de cunoaştere psihologică trebuie utilizat ţinând seama de limitele valorii sale diagnostice şi prognostice. Din această cauză psihologul trebuie să cunoască în amănunt aceste calităţi înainte de a-l folosi pentru cunoaşterea psihologică a persoanei în diferite scopuri. În acest capitol vom prezenta cele mai importante calităţi ale testelor: fidelitatea, validitatea şi standardizarea.

IV.1. DEFINIREA FIDELITĂŢII Există frecvent credinţa eronată că testul ar măsura toate aspectele cuantificabile ale conduitelor sau reacţiilor umane. În realitate testul extrage, din variaţiile teoretic infinite ale conduitelor subiectului, un număr limitat de eşantioane de conduită, pe care le măsoară, oferind o imagine lacunară asupra conduitei reale a persoanei testate. Se observă că testarea repetată a unei persoane cu aceeaşi probă, sau cu probe paralele duce la obţinerea unor rezultate fluctuante, la o variaţie mai mult sau mai puţin accentuată. Scorurile obţinute la testele psihologice provin din răspunsurile date de diferiţi subiecţi. Una din caracteristicile comportamentului uman este că acesta se modifică în timp, aspect care ne face să ne preocupe constanţa scorurilor. Eşantionarea itemilor, circumstanţele particulare de administrare a testului şi caracteristicile subiecţilor determină inconstanţa în măsurare. Măsurările fizice sunt în general

37

CORNEL HAVÂRNEANU

stabile, iar diferenţele dintre scoruri sunt uşor de explicat, ceea ce nu se întâmplă în cazul măsurătorilor psihologice, la care scorurile sunt influenţate de condiţii exterioare. Teoria preciziei testului (termen generic pentru desemnarea studiului consistenţei interne) este importantă prin două probleme fundamentale: Prima constă în gradul de consistenţă a rezultatelor, şi se referă la relaţia între scorurile obţinute în diferite situaţii de aplicare a testelor; iar a doua la cauzele diferenţelor observate între scoruri, deci a cunoaşte factorii care determină scorurilor inconstante şi importanţa efectului lor. Caracterul inconsecvent al rezultatelor brute ridică problema fidelităţii instrumentului care în esenţă ridică trei probleme: a. Cât de variabile, de fluctuante sunt rezultatele subiectului de la o măsurare la alta? În această situaţie fidelitatea constă în stabilitatea rezultatelor în timp şi în consecinţă în predictibilitatea lor. b. Valorile obţinute la o probă sunt adevăratele valori ale aspectului psihologic măsurat? Diferenţele interindividuale, constatate în privinţa cotelor obţinute la test, pot fi explicate prin diferenţe reale dintre subiecţi? În această situaţie fidelitatea se referă la acurateţea, precizia cu care testul măsoară ceea ce şi-a propus să măsoare. c. Cât de mare este eroarea de măsurare (totalul erorilor întâmplătoare) a testului? În această situaţie fidelitatea se referă la absenţa relativă a erorilor de măsurare. Teoria clasică a testelor furnizează elementele de bază, necesare pentru rezolvarea acestei probleme. Ea se bazează pe câteva postulate, definiţii şi relaţii. După teoria clasică a testelor toate scorurile observate (X) sunt compuse din două părţi: un scor adevărat (A) şi un scor eroare (E). Această relaţie poate fi reprezentată sub forma ecuaţiei: X = A + E Se pune însă problema sensului pe care îl dăm scorului observat. Acest concept poate fi definit în mai multe feluri. 1. Îl putem considera ca un scor obţinut cu un test perfect, deci un test care măsoară fără eroare. De fapt, dacă putem efectua măsurări fără eroare, toate scorurile observate pot fi considerate ca adevărate. Acest lucru este imposibil deoarece întotdeauna există un gard de eroare. 2. Există şi o altă manieră de înţelegere a scorului adevărat. Lord şi Novick (1968) dau o altă definiţie scorului adevărat elaborând postulatele de bază şi relaţiile dintre scorurilor adevărate şi eroare. Scorul adevărat al unui subiect (s) obţinut cu un instrument dat (i) este definit ca valoarea aşteptată a scorului observat: Asi = ε Xis unde: Asi este o constantă, Xis este o variabilă oarecare, iar ε este valoarea aşteptată. Deci, scorul aşteptat al unui subiect (s) obţinut cu instrumentul (i) este valoarea aşteptată (ε) a răspunsului la instrumentul (i) dat de subiectul (s). O altă manieră de exprimare a relaţiei dintre un scor adevărat şi un scor observat, constă în a descrie scorul adevărat ca fiind scorul mediu a unui subiect pentru un număr infinit de utilizări a aceluiaşi instrument de măsură.

38

PSIHODIAGNOSTIC (I)

Un alt concept important în teoria clasică a testelor este cel de eroare (E). Eroarea poate fi definită ca fiind diferenţa dintre scorul adevărat şi scorul observat: Esi = Xis - Asi Acest tip de eroare este datorată hazardului ceea ce exclude toate sursele sistematice de variaţie a erorii. După aceste constatări putem apela la calcularea mediei şi a varianţei pornind de la relaţia iniţială şi prin calcule vom obţine: X m = Am Media scorurilor observate este egală cu media scorurilor adevărate. Termenul Em, dispare din ecuaţie când valorile aşteptate ale erorilor (variabile aleatoare) tind spre zero. În consecinţă, efectele erorilor au tendinţa să se anuleze dacă numărul de observaţii tinde spre infinit. Aceeaşi procedură poate fi aplicată şi pentru varianţă şi vom obţine: S2X = S2A + S2E atunci când erorile tind spre zero Acesta este o ecuaţie fundamentală care are o mare importanţă pentru că ne permite să construim o definiţie simplă şi interesantă a fidelităţii unui test. Un postulat important a acestei teorii este că scorurile adevărate şi scorurile eroare nu sunt în corelaţie, adică rAE = 0. Se postulează de asemenea că scorurile eroare la diverse măsurări nu sunt în corelaţie, adică rE1E2 = 0. Este suficient să utilizăm egalitatea fundamentală pentru definirea fidelităţii: S2X=S2A + S2E Dacă împărţim fiecare din aceste elemente prin aceeaşi cantitate S2X, adică varianţa rezultatelor observate, vom obţine:

S2X S2A S2E = + S2X S2X S2X

1=

adică

S2 A S2E + S2X S2X

S2 A S2E este proporţia varianţei observate care provine din varianţa adevărată, iar este S2X S2X proporţia varianţei observate care provine din varianţa eroare.

unde

Precizia poate fi definită ca fiind un raport de varianţă: rXX = 1

S2A unde rXX 1 desemnează 2 SX

coeficientul de fidelitate, adică proporţia varianţei observate care provine din varianţa adevărată. Sau putem scrie formula sub forma rXX = 1 − 1

S 2E , adică unu minus proporţia varianţei observate S X2

care provine din varianţa eroare. Relaţia care există între cele trei varianţe poate fi reprezentată sub forma: (1) (2)

S2A S2E

S2E S2A

39

CORNEL HAVÂRNEANU

Unde cazul (1) arată un raport de fidelitate mai mare decât cazul (2). Coeficientul de fidelitate corespunde unui raport de varianţă şi poate lua valori între 0 şi 1, deci numai valori pozitive. Ecuaţia următoare reflectă bine acest lucru: S2E 1 rXX = 1 − 2 S X Dacă varianţa eroare (S2E) este maximă, ea este egală cu varianţa observată a testului (S2X). În acest caz, putem spune că varianţa observată este dată numai de erori şi coeficientul de fidelitate este nul. Fidelitatea este certitudinea că un test măsoară scorurile adevărate, iar coeficientul de fidelitate dă gradul de fidelitate. Putem stabili un raport între scorurile adevărate şi scorurile observate. Dacă luăm în consideraţie deviaţia scorurilor de la medie prin calcul vom obţine:

rXA = rXX 1 Corelaţia dintre scorurile adevărate şi scorurile observate este egală cu rădăcina pătrată a coeficientului de fidelitate.

IV.2. DEFINIŢIA ERORII Variabilitatea scorurilor observate SX, poate să fie cunoscută direct, existând procedee pentru a estima coeficientul de fidelitate. Dacă notăm (SE, abaterea standard a erorilor şi cu S2E varianţa erorilor), pe baza acestor parametri putem rezolva o problemă practică. S2

E

=

S2

x

-

S2

A

dar

rXX

1

S2A = 2 S X

S2E = S2x -S2x rxx 1 = S2x (1 – rxx1)

deci deci

S 2 A = S 2 X rXX 1

S E = S X 1 − rXX 1

SE este denumită eroarea standard de măsurare sau eroarea probabilă. SE reprezintă eroarea aleatoare care nu poate fi eliminată din măsurare, dar trebuie luate măsuri pentru a o reduce cât mai mult. Vom spune că măsurarea este fidelă sau precisă în măsura în care există cât mai puţine erori posibile sau valoarea SE este cât mai mică posibil. Teoretic eroarea este nulă. Noţiunea de fidelitate presupune reproducerea scorurilor, adică posibilitatea de a obţine aceleaşi rezultate de la aceiaşi subiecţi, în aceleaşi condiţii dar, în ocazii diferite, cu teste care măsoară aceiaşi trăsătură. Teoria clasică a testelor este o soluţie pe care o putem aplica la teoria erorilor de măsurare. Se precizează că pentru un scor adevărat dat, mai multe măsurări echivalente ale aceleiaşi trăsături în aceleaşi condiţii este un mijloc pentru o bună aproximare. Scorurile obţinute se distribuie simetric deasupra şi dedesubtul scorului adevărat. Distribuţia erorilor aleatoare se repartizează normal şi se aşteaptă o distribuţie a scorurilor observate în scorului adevărat. Să presupunem că dispersia erorilor este aceiaşi pentru fiecare subiect iar abaterea standard a erorilor poate să fie cunoscută sau estimată. Aceasta se numeşte eroarea standard de măsurare: S E = S X 1 − rXX 1

40

PSIHODIAGNOSTIC (I)

Problema măsurării constă în a determina această eroare, pe care trebuie să s-o eliminăm, cât mai mult posibil, pentru a controla factorii care influenţează scorurile observate. De exemplu, dacă SE=1,3, rxx1 =0,60 şi Sx = 2,00, atunci pe baza acestor date putem interpreta un rezultat observat în funcţie de eroare şi putem determina limitele între care se poate situa rezultatul adevărat al subiecţilor care au acelaşi rezultat observat. Astfel: X - 1SE < A < X + 1SE pentru o probabilitate de 0,68 X - 2SE < A < X + 2SE pentru o probabilitate de 0,95 X - 3SE < A < X + 3SE pentru o probabilitate de 0,99 Dacă X = 7 atunci avem: 7 - 1,3 < A < 7 + 1,3 7 - 2,6 < A < 7 + 2,6 7 - 3,9 < A < 7 + 3,9 adică 3,1 < A < 10,9 Aceasta înseamnă că pentru un rezultat observat 7, rezultatele adevărate pot fi situate între 3,1 şi 10,9, cu o probabilitate de 99,7%. IV.3. SURSELE ERORILOR DE MĂSURARE Pentru a putea diminua pe cât posibil erorile de măsurare este important să cunoaştem sursele de eroare. O variabilă produce erori dacă nu este validă şi dacă se obţin rezultate inconstante atunci când se fac mai multe măsurări. Există trei surse principale de eroare: 1. erori produse de testul însuşi; 2. erori legate de condiţiile de aplicare a testului; 3. erori legate de subiecţii care răspund la test Prima categorie cuprinde factori controlabili ca: eşantionarea itemilor, dacă testul presupune măsurarea unei trăsături foarte precise, ambiguitatea enunţurilor, imprecizia instrucţiunilor în legătură cu maniera de răspuns, o limită de timp neadecvată. Toate acestea determină răspunsuri date la întâmplare, ceea ce duce la o instabilitate a răspunsurilor şi o reducere a fidelităţii testului. A doua categorie se referă la procedeele de prezentare a testului. Dacă aceste procedee sunt standard riscurile de eroare sunt scăzute. Lipsa de experienţă a grupului testat, neobişnuinţa subiecţilor de a răspunde la teste poate fi un factor de eroare. Lipsa de concentrare a subiecţilor, erorile de redactare a instrucţiunilor şi deficienţele de cronometrare, sunt erori care fac parte din această categorie. Aceste două categorii conţin surse de eroare uşor de controlat, faţă de cele din a treia categorie, unde sursele de eroare depind de subiecţi. Psihologii au evidenţiat multe surse de eroare de acest tip. Aici le vom menţiona pe cele mai importante ca: motivaţia, obişnuinţa cu testarea, anxietatea, diferenţele de învăţare şi variabile de natură fiziologică. Există erori de măsurare dacă subiecţii examinaţi sunt motivaţi diferit. Dacă condiţiile de aplicare a testului se modifică de la o aplicare la alta atunci trebuie să ne aşteptăm şi la o modificare a rezultatelor. Testele de randament sunt afectate de aceste erori. Se postulează că subiecţii au o experienţă echivalentă indiferent de procedeul utilizat şi maniera de testare. Tot timpul, două situaţii indezirabile, care introduc erori de măsurare, pot să apară. Pe de o parte, lipsa de experienţă a unor subiecţi, se materializează în incapacitatea acestora, mai 41

CORNEL HAVÂRNEANU

mare sau mai mică, de o obţine un randament ridicat, situaţie în care scorul nu reflectă gradul de prezenţă a trăsăturii măsurate. Pe de altă parte, sunt persoane care au experienţă în rezolvarea testelor şi obţin un randament ridicat, fapt care de asemenea nu este în concordanţă cu nivelul trăsăturii măsurate. Aceste două situaţii determină erori de măsurare şi diminuează fidelitatea. Multe persoane manifestă o oarecare nervozitate atunci când sunt testate. Există o marjă de încredere, justificată sau nu, faţă de gradul prezenţei trăsăturii măsurate, care determină stări de anxietate. Anxietatea afectează randamentul şi reduce punerea în valoare a posibilităţilor subiectului. Un alt factor de eroare este legat de variabile fiziologice. Acest factor este inevitabil când acestea sunt imprevizibile. Problema erorilor de măsurare a fost prezentată anterior, dar este important să facem câteva precizări suplimentare. Componentele "eroare" ale scorurilor observate la un subiect pot fi considerate ca suma erorilor care provin din surse precise de eroare. Aceste surse de eroare sunt independente unele de altele, între ele nu există nici o corelaţie. Acest aspect este un postulat. Pentru fiecare sursă de eroare, se poate trasa curba erorilor mai multor subiecţi, în care varianţa distribuţiei erorilor este formată din suma distribuţiilor provenite de la fiecare sursă de eroare. Estimarea fidelităţii depinde de estimarea varianţei eroare, adică distribuţia erorilor (S2E). Metoda de estimare a fidelităţii trebuie orientată spre estimarea diferitelor varianţe eroare (S2E), pentru că există surse de eroare diferite care intervin de fiecare dată. Pentru evaluarea unui coeficient de fidelitate este foarte important să cunoaştem metode pentru a repera sursele de varianţă care pot interveni. Aceste surse pot fi următoarele: ‚ varianţa distribuţiei erorilor ca rezultat al unei schimbări care apare într-o situaţie sau alta, într-un mediu sau altul (S2E); ‚ varianţa care decurge din subiectivitatea corectării (S2ES); ‚ varianţa datorată hazardului (S2EH), sau altor surse: memorie (S2EM), oboseală (S2EO) Fidelitatea unui instrument de măsură se defineşte ca fiind corelaţia sau coeficientul de concordanţă între două teste paralele sau două teste paralele la care eşantionul de itemi a fost extras din aceeaşi populaţie de itemi. Indicele obţinut este un coeficient de corelaţie între măsurări care dau acelaşi scor adevărat pentru fiecare subiect. Acest indice arată precizia cu care un item ne permită să măsurăm o caracteristică. De asemenea, coeficientul de corelaţie la pătrat indică proporţia varianţei între două măsurări. S2A 1 2 rXX = r XA = 2 S X Putem afirma, pe baza definiţiei fidelităţii, că acest coeficient indică proporţia din varianţa totală care rezultă din diferenţele dintre scorurile adevărate. Din aceste diferenţe rezultă de fapt adevăratele diferenţe dintre indivizi. Acest coeficient este un indicator al inconstanţei erorilor, care are valoare minimă dacă testele sunt într-adevăr paralele. El este denumit coeficient de precizie. Mulţi cercetători, printre care şi Lord şi Novik (1968), au demonstrat că procedeele standard care servesc la estimarea coeficientului de fidelitate şi la varianţa erorilor unui test presupun cel puţin două măsurări (scoruri) pentru fiecare subiect şi că precizia estimării creşte o dată cu numărul acestor măsurări. Varianţa erorii pentru un anumit subiect S2Esx presupune cel puţin două măsurări şi precizia creşte o dată cu numărul observaţiilor asupra persoanei măsurate. Deci, deşi coeficientul de precizie nu este nici foarte pertinent şi nici foarte practic, el constituie totuşi un indice al gradului de imprecizie care poate fi atribuit viciilor de formă sau de procedură.

42

PSIHODIAGNOSTIC (I)

Dacă itemii testelor paralele sunt extraşi din aceeaşi populaţie de itemi, coeficientul de fidelitate indică gradul de certitudine cu care poate fi măsurată o trăsătură, chiar dacă s-a folosit doar un eşantion de itemi din populaţia respectivă. În acest fel, mai multe eşantioane aleatoare, cu acelaşi număr de itemi, pot să constituie teste paralele şi permit să se obţină mai mulţi coeficienţi de corelaţie. Media lor este cea mai bună estimare a coeficientului de corelaţie aşteptat pentru testele paralele cu aceeaşi lungime, eşantionate aleator. Numărul de itemi şi gradul de omogenitate al populaţiei de itemi, adică gradul în care măsoară aceeaşi variabilă, sunt doi factori care determină această medie. Coeficientul care indică gradul legăturii între testele paralele, formate din eşantioane alese aleator, este denumit coeficient de consistenţă internă. În practică testele nu satisfac exigenţele testelor strict paralele, cu toate că în ansamblu ele măsoară acelaşi scor adevărat şi corelaţia între teste este pozitivă. Coeficientul de fidelitate, cunoscut ca fiind corelaţia dintre teste paralele, este afectat de varianţa proprie a fiecărui test. Cu toate că este vorba de varianţă adevărată, ea este considerată ca eroare. Coeficientul de echivalenţă este coeficientul reprezentat de corelaţia între teste sau forme paralele şi varianţa specifică are ca efect subestimarea adevăratului coeficient de fidelitate. IV.4. METODE DE ESTIMARE A FIDELITĂŢII IV.4.1. Metoda testelor paralele Această metodă constă în calcularea corelaţiei între două forme ale aceluiaşi test format din itemi diferiţi. Ea dă o aproximare a gradului de echivalenţă între teste atunci când le aplicăm aceluiaşi grup de subiecţi la un interval scurt de timp. Acest tip de coeficient este mai fiabil decât coeficientul de precizie deoarece el indică corelaţia dintre două forme aproape paralele. Imprecizia de măsurare şi varianţa adevărată care decurge din lipsa paralelismului dintre forme (varianţa adevărată specifică), sunt tratate ca erori şi tind să reducă coeficientul de echivalenţă. Intervalul de timp dintre cele două aplicări ale testului fiind mic, putem considera că se produce o scădere a fluctuaţiilor posibile între scorurile adevărate datorate celor două aplicări, ceea ce permite să reducem S2AF (varianţa eroare datorată fluctuaţiilor scorurilor adevărate, în diferite ocazii) şi în consecinţă S2E (varianţa eroare). IV.4.2. Metoda test - retest Metoda constă în a aplica acelaşi test de două ori aceluiaşi grup de subiecţi la un interval mai mic sau mai mare de timp şi a calcula corelaţia dintre rezultatele obţinute. Aplicarea acestei metode comportă mai multe dificultăţi. Efectul exerciţiului sau a memorării poate influenţa subiecţii la a doua aplicare, astfel încât erorile înregistrate în cursul celor două prezentări au tendinţa să fie în corelaţie. Mai mult, modificarea abilităţii subiecţilor contribuie de asemene la eroare. Este deseori dificil de precizat dacă eroarea este efectul creşterii sau diminuării corelaţiei între rezultate. După Gulliksen (1950), corelaţia va fi mai mare dacă intervalul de timp dintre cele două prezentări este scurt şi oboseala intervine în mică măsură. În acest caz corelaţia obţinută este o supraestimare a coeficientului de precizie. Dacă intervalul dintre prezentări este lung, memoria intervine mai puţin, iar efectul este reducerea corelaţiei. Dacă considerăm fluctuaţia scorurilor adevărate, eroare, fidelitatea este subestimată, iar dacă efectul memoriei este considerat ca varianţă adevărată, fidelitatea este supraestimată. Varianţa atribuită fluctuaţiei scorurilor adevărate creste o dată cu durata intervalului dintre cele două prezentări, iar efectul memoriei scade. Intervalul ideal permite reducerea, pe cât posibil, a efectului combinat al celor doi factori. A. Anastasi consideră că definirea exactă a varianţei eroare este dificilă. Un factor irelevant 43

CORNEL HAVÂRNEANU

pentru un scop diagnostic poate fi relevant pentru un altul şi invers. Deci, unul şi acelaşi factor poate fi considerat, în funcţie de scopul testării, când varianţă adevărată când varianţă eroare. De exemplu, dacă se urmăreşte starea afectivă actuală a unei persoane (dispoziţia emoţională, nivelul anxietăţii etc.), atunci se preferă teste care relevă varianţa cotelor brute de la o testare la alta. Dacă se urmăreşte prognoza şcolară sau profesională, atunci se preferă teste care surprind stabilitatea în timp a conduitelor. În primul caz stabilitatea în timp a rezultatelor este contraindicată, în celălalt ea este de dorit. Deci, sensul erorii depinde de scopul testării. Când condiţiile care determină cota subiectului sunt mereu irelevante pentru scopul urmărit, ele intră în categoria varianţei eroare şi putem spune că fidelitatea nu există sau este foarte mică. IV.4.3. Metoda de analiză a varianţei interne Metoda înjumătăţirii Datorită limitelor pe care le posedă metodele prezentate anterior, şi a faptului că fidelitatea este estimată printr-un coeficient de echivalenţă, metoda înjumătăţirii (split half) este utilă. În mod obişnuit, procedeul constă în a ordona itemii în ordinea dificultăţii. Apoi vom împărţi testul în două, echilibrând gradul de dificultate a fiecărei părţi pe baza indicelui pi (indicele de dificultate a itemului) pentru fiecare item. În acest fel construim două teste de dificultate şi variabilitate echivalente în aşa fel încât mediile şi abaterile standard să aibă valori cât mai apropiate posibil. Cele două teste vor măsura aceleaşi scoruri adevărate deci, ele măsoară acelaşi conţinut şi există o corelaţie pozitivă perfectă între scorurile adevărate. Metoda presupune obţinerea unui scor de către fiecare subiect pentru fiecare jumătate şi calcularea corelaţiei dintre aceste scoruri. Metoda fidelităţii prin înjumătăţire nu poate fi utilizată pentru teste de viteză. Coeficientul alfa şi coeficientul Kuder-Ricardson (KR20) Este posibil să divizăm un test în atâtea părţi câţi itemi sunt. Putem postula că toţi itemii sunt paraleli, deci au aceeaşi medie, aceeaşi varianţă şi intercorelaţii egale. Kuder şi Ricardson (1937) au obţinut o ecuaţie care permite să obţinem coeficienţi de fidelitate. Cronbach a demonstrat că KR20 (caz special al coeficientului α) este egal cu media tuturor coeficienţilor obţinuţi prin metoda înjumătăţirii, calculaţi prin formula lui Rulon sau Guttman, pentru toate jumătăţile posibile ale unui test. KR20 este un coeficient de omogenitate sau de consistenţă internă care dă o mai bună estimare a fidelităţii. El poate fi considerat ca fiind corelaţia între teste paralele dacă eşantionarea itemilor s-a făcut prin hazard. Varianţa adevărată este, deci dependentă de valoarea covarianţei dintre itemii unui test şi este determinată de intercorelaţii şi varianţele itemilor. Aceasta ne permite să afirmăm că coeficientul KR20 (indicele de consistenţă internă) depinde de corelaţiile dintre itemi, deci de gradul în care măsoară aceeaşi variabilă, cum s-ar spune de omogenitatea itemilor. IV.5. UTILITATEA ŞI INTERPRETAREA COEFICIENTULUI DE FIDELITATE Cum interpretăm un coeficient de fidelitate şi când poate fi considerat acceptabil? Răspunsul la această întrebare nu este evident, dar există. Cum am văzut deja, pentru un test putem calcula mai mulţi coeficienţi, diferiţi din punct de vedere a valorii calitative. Fiecare reprezintă estimarea valorii inconstanţei rezultatelor şi nu o estimare a cauzei erorilor. Va trebui deci, să examinăm formele de interpretare a unui coeficient de fidelitate.

44

PSIHODIAGNOSTIC (I)

Deşi există mai multe posibilităţi de calcul al coeficientului de fidelitate, în mod curent se vorbeşte despre gradul de fidelitate pentru a desemna valoarea erorilor de măsurare cu testul respectiv. Nunnally (1982) sugerează că cel puţin doi coeficienţi diferiţi trebuie utilizaţi pentru a cunoaşte fidelitatea unui test: coeficientul α calculat pentru fiecare formă a testului şi corelaţia între forme paralele. Alţi autori recomandă calcularea coeficientului de echivalenţă - stabilitate. Este important ca cercetătorul să ţină seama de necesităţi şi de context. De exemplu, pentru o corectare subiectivă efectuată de mai mulţi corectori, corelaţia mediei dintre scorurile celor două forme ale testului este un bun indice de fidelitate. Metoda prin înjumătăţire poate fi folosită dacă nu există o formă paralelă a testului. În toate cazurile va fi folosită metoda care duce la o estimare cât mai prudentă şi verosimilă. Există patru forme de interpretare a unui coeficient de fidelitate: - ca o corelaţie dintre scorurile obţinute şi scorurile adevărate; - ca un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură; - ca procent al subiecţilor care-şi schimbă rangul sau poziţia; - ca un indice al gradului de eroare între scorurile individuale. Corelaţia dintre scorurile obţinute şi scorurile adevărate Coeficientul de fidelitate este un raport de varianţă, prin care se poate stabili cât din proporţia de varianţa totală aparţine varianţei adevărate. De exemplu, dacă rxx1 = 0.90, putem spune că 90% din variabilitatea scorurilor observate decurge din varianţa adevărată şi 10% din varianţa eroare. Evident că rxx1 = 0, presupune că variabilitatea este datorată în totalitate erorilor. De asemenea, un coeficient de fidelitate poate fi interpretat ca fiind proporţia din varianţa observată care provine din diferenţele dintre scorurile adevărate. Mai precis, el indică gradul erori de măsurare obţinut prin administrarea unei forme a unui test la un eşantion particular de subiecţi în condiţii bine precizate. Un standard de comparaţie a preciziei unui test cu precizia altor teste de aceeaşi natură O valoare foarte ridicată de 0,90 sau mai mare, observată la un test standard, care serveşte la măsurarea randamentului, aptitudinilor sau abilităţilor, poate servi drept criteriu de comparaţie pentru aţi coeficienţi. Pentru testele de personalitate, norma criteriu se situează la 0,80. Schimbarea rangului subiecţilor Dacă precizia este perfectă, fiecare subiect primeşte acelaşi rang la fiecare prezentare a testului. Thorndike şi Hagen (1977) au prezentat tabelele de schimbare a rangurilor pentru diversele valori ale coeficientului de fidelitate. Rangurile pe care le au doi subiecţi se schimbă în funcţie de valoarea coeficientului de fidelitate. De exemplu, dacă scorurile a doi subiecţi sunt plasate în centilul 75 respectiv 50, aceste se inversează dacă precizia testului are valori diferite. Dacă rxx1 = 0.60 sunt 33% şanse ca doi subiecţi plasaţi în centilele 75 şi 50 să-şi schimbe poziţia şi numai 2% şanse de schimbare a poziţiei dacă rxx1 = 0.90. Schimbarea rangului dintre subiecţi nu depinde numai de precizia testului ci si de numărul claselor. Cu cât clasele sunt mai mici cu atât există mai multe şanse de schimbare. Gradul de eroare între scorurile individuale Gradul de eroare este invers proporţional cu gradul de fidelitate a unui test. Problema este de a determina pentru fiecare subiect intervalul în care se află scorul adevărat.

45

CORNEL HAVÂRNEANU

rxx

1

De exemplu, presupunem o medie Xmed = 60, o abatere standard Sxx = 5 şi o fidelitate a testului = 0.84. În acest caz eroarea de măsurare este:

S E = S X 1 − rXX 1 = 5 1 − 0,84 = 2 Pentru un scor X = 57 şi un grad de confidenţă de 0,95 vom obţine: X - ZSE < A < X + ZSE 57 - (1,96 x 2) < A < 57 + (1,96 x 2) 53,08 < A< 60,92 unde Z este scorul standard luat de valorile care determină probabilităţi exacte pe o curbă normală, iar A = scor adevărat. Există deci, 95 % şanse ca un scor observat de 57 să corespundă unui scor adevărat situat intre 53 şi 61. Eroarea de măsurare care este un indice al variabilităţii scorurilor observate faţă de scorurile adevărate constituie o estimare a gradului atenuare a scorurilor aşteptate la o eventuală nouă prezentare a testului. Cu cât eroarea de măsurate este mai mare cu atât intervalul în care se plasează scorurile adevărate este mai mare. ÎN CONCLUZIE: 1. Coeficientul de fidelitate teoretic se situează la 1,00, iar practic trebuie să fie cât mai ridicat posibil. 2. Fidelitatea unui test este un concept pur teoretic pentru că un coeficient de precizie se aplică exclusiv unui test, unui eşantion de teste menţinând constant testul şi metoda de calcul. 3. Dacă comparăm gradul de fidelitate a mai multor teste, nu putem spune că un test este mai precis decât altul decât dacă unul dintre ele are un coeficient de precizie foarte ridicat decât alte teste care au fost prezentate de mai multe ori.

46

PSIHODIAGNOSTIC (I)

V. VALIDITATEA TESTELOR

V.1. DEFINIŢIE ŞI GENERALITĂŢI Validitatea, care este determinată în funcţie de gradul de varianţă adevărată al variabilei măsurate, poate fi definită ca fiind: • gradul în care un test măsoară o trăsătură, un construct sau un factor; • relaţia dintre scorurile obţinute la test şi o măsurare a unui criteriu exterior. După Legendre (1993), validitatea este "capacitatea unui instrument de a măsura realmente ceea ce şi-a propus să măsoare după utilizarea acestuia". Conceptul de validitate este un termen generic care se referă la următoarele probleme: • Tipul de test folosit este potrivit utilizării care i-a fost destinată? • Care sunt trăsăturile măsurate de test? • În prezent testul măsoară ceea ce el trebuie să măsoare? • Informaţiile furnizate de test sunt utile pentru a lua decizii? • Ce interpretări putem face pe baza scorurilor obţinute la test? • Ce predicţii putem face pe baza acestor scoruri? • Care este gradul de varianţă care rezultă din variabila măsurată de test? Validitatea este tot timpul legată de o situaţie particulară ceea ce înseamnă că în alte condiţii, pe alte eşantioane sau metode de analiză vom obţine rezultate diferite. Validitatea nu poate fi extinsă la ansamblul situaţiilor. A spune că un test este mai valid decât altul nu are sens decât dacă testul se dovedeşte a fi valid într-o foarte mare varietate de situaţii sau pentru un foarte mare număr de scopuri de testare.

V.2. DISTINCŢIA DINTRE FIDELITATE ŞI VALIDITATE Fidelitatea se referă la precizia cu care un test măsoară anumite caracteristici în timp ce validitatea vizează calitatea măsurării. Am definit fidelitatea ca fiind un raport de varianţă şi în aceeaşi manieră vom defini validitatea ca fiind proporţia de varianţă adevărată care este pertinentă scopurilor de utilizare a unui test. După cum s-a precizat deja validitatea vizează două aspecte: unul se referă la calitatea cu care un test măsoară o trăsătură ipotetică sau un construct, iar al doilea se referă la relaţia dintre scorurile obţinute la un test şi o măsură criteriu. Definiţia validităţii poate fi exprimată prin ecuaţia: S2A = S2p + S2n unde: S2p = varianţa pertinentă; S2n = varianţa non pertinentă dar valabilă Deci: S2X = S2p + S2n + S2E

47

CORNEL HAVÂRNEANU

Varianţa totală a unui test este formată din varianţa validă, varianţa non pertinentă dar şi din varianţa eroare. Dacă varianţa eroare scade, deci fidelitatea creşte (S2A / S2X), varianţa validă potenţială creşte, dar această varianţă poate fi pertinentă sau nu pentru o situaţie dată. De asemenea, o mică varianţă eroare nu garantează o validitate mare şi în acelaşi timp o fidelitate mare este o condiţie necesară dar nu suficientă pentru o validitate mare pentru un test dat într-o situaţie dată. Studiul validităţii vizează erorile sistematice, cel al fidelităţii erorile aleatoare. Legătura dintre cele două concepte evidenţiază faptul că un coeficient de validitate rXY nu poate depăşi valoarea rădăcinii pătrate a coeficientului de fidelitate rXX1, ceea ce înseamnă că validitatea este tot timpul limitată de fidelitatea unui test. Următoarele situaţii demonstrează acest fapt: 1. O fidelitate mare şi o validitate mare S2p

S2n

S2E

2. O fidelitate mare şi o validitate slabă S2p

S2n

S2E

3. O fidelitate slabă şi o validitate relativ ridicată S2p

S2n

S2E

4. O fidelitate slabă şi o validitate slabă: S2p

S2n

S2E

unde: S2p = varianţa pertinentă S2n = varianţa non pertinentă S2E = varianţa eroare S2A = S2p + S2n Deci fidelitatea este o condiţie necesară dar nu suficientă, deoarece validitatea trebuie să fie prezentă. Este important de subliniat că un test valid este în mod necesar şi fidel, dar un test fidel nu este în mod necesar şi valid. O varianţă a erorii scăzută nu garantează o creştere a validităţii deoarece varianţa adevărată poate fi în mare parte non pertinentă.

V.3. TIPURI DE VALIDITATE Există mai multe tipuri de validitate în funcţie de scopul testării sau examinării: validitate predictivă, validitate de conţinut, validitate teoretică. În literatura actuală se vorbeşte şi de validitate aparentă (face validity), care se referă direct la conţinutul şi structura testului. Dacă un test are validitate aparentă atunci există o corespondenţă logică evidentă între itemii testului şi ceea ce testul îşi propune să măsoare.

48

PSIHODIAGNOSTIC (I)

Validitatea de conţinut Dacă dorim să cunoaştem randamentul unui individ în universul situaţiilor în care testul este un eşantion, conţinutul testului constituie aspectul primordial care trebui luat în seamă, şi atunci testul devine universul în care itemii sunt eşantioane de situaţii. De asemenea, precizia răspunsurilor şi procedeul de rezolvare a itemilor testului prezintă un mare interes. Evaluarea validităţii de conţinut se face în funcţie de gradul de pertinenţă a eşantionului de itemi. Dar, neexistând un indice cantitativ de pertinenţă a eşantionului, evaluarea se face prin judecăţi sau prin procese raţionale. Validitatea de teoretică Testele psihologice permit studierea caracteristicilor umane. În acest caz trebuie să cunoaştem trăsătura pe care testul o măsoară. Dacă vom cunoaşte care este trăsătura măsurată, o vom putea utiliza pentru studiul diferenţelor individuale şi pentru elaborarea teoriilor organizării trăsăturilor. Pentru acest tip de validitate, trăsătura măsurată este aspectul esenţial şi estimarea validităţii se face prin reliefarea prezenţei relative a trăsăturii. Reliefarea acestor prezenţe poate fi făcută în mai multe feluri folosind diverse surse, apelându-se la studii de validitate predictivă şi de conţinut. Ca şi în ca validităţii de conţinut evaluarea se face prin raţionament. Validitatea predictivă Putem folosi testele pentru a face predicţii relative la randamentul subiecţilor la un criteriu. Putem folosi drept criteriu media şcolară sau randamentul în muncă. Criteriul este un indicele de predicţie dat de validitatea predictivă a unui test. Un aspect important a acestui tip de validitate este criteriul, deoarece scorul obţinut la test este util în măsura în care poate prezice un criteriu, conţinutul fiind în acest caz un aspect secundar.

V.4. VALIDITATEA PREDICTIVĂ Majoritatea testelor sunt folosite pentru predicţia randamentului. Testele de aptitudini şcolare servesc pentru predicţia şanselor de reuşită şcolară, inventarele de interese permit cunoaşterea câmpurilor de interese profesionale, inventarele de personalitate permit evidenţierea unor dezechilibre psihice care pot determina anumite predispoziţii, testele de randament sunt utilizate pentru selecţie şi plasare profesională, testele de aptitudini şi abilităţi profesionale permit predicţia productivităţii şi stabilităţii în muncă. În toate cazurile, variabila care face obiectul predicţiei este denumită criteriu. Criteriul este măsurarea randamentului într-un mod diferit de cel desemnat de variabila predictivă. Modelul care permite măsurarea acestui tip de validitate constă în stabilirea relaţiei între scorurile obţinute la test şi cele obţinute la criteriu. Expresia "validitate predictivă" se referă la faptul că folosind testul putem realiza predicţia criteriului. Expresia "validitate empirică" se referă la faptul că determinarea validităţii predictive presupune totdeauna colectarea unor date empirice din care decurge relaţia dintre scorurile obţinute la test şi cele obţinute la criteriu.

49

CORNEL HAVÂRNEANU

Validitatea predictivă şi luarea deciziilor Predicţia vizează luarea unei decizii şi pentru aceasta validitatea predictivă este foarte utilă. Atunci când dorim să luăm o decizie pentru selecţie, clasament sau plasament vom folosi teste care ne oferă scoruri individuale pe baza cărora decidem. În acelaşi timp putem folosi şi alte urse de informaţii. Este însă dificil să stabilim importanţa relativă a scorurilor la teste comparativ cu informaţiile care provin din alte surse. Mulţi autori, printre care şi Brown (1970), susţin că măsurarea validităţii predictive măreşte şansele ca o decizie luată pe baza scorurilor unui test să fie exactă, faţă de exactitatea unei decizii luată pe baza unor alte surse de informaţii. Validitatea unui test este judecată în funcţie de corelaţia sa cu criteriul şi de gradul în care scorurile criteriu nu reprezintă corect scopul propus (slăbiciunea criteriului). De exemplu, să considerăm că pentru reuşita şcolară luăm media cumulată drept criteriu. Dacă testul ne permite predicţia, cu un anumit grad de precizie, a mediilor cumulate, este posibil ca membrii consiliului profesoral să nu fie în măsură să aleagă tipul de student care va fi admis. În consecinţă, folosirea testului a oferit posibilitatea de a fi admişi, într-o proporţie crescută, numai studenţii care vor obţine medii ridicate. Studenţii aleşi în acest fel posedă însă şi alte caracteristici care sunt legate de capacitatea de a obţine note ridicate. În concluzie, problema constă în avantajul de a lua decizii legate de grupuri decât de indivizi. Validitatea este tot timpul estimată pe baza datelor grupului, şi logic enunţurile referitoare la validitatea unui test ne vor trimite înapoi la validitatea unui ansamblu de scoruri şi nu la scorul unui subiect. Criteriile În toate studiile de validitate predictivă criteriul este un element foarte important. Interesul pentru un test predictor este tot timpul în funcţie de relaţia sa cu criteriul. Dacă un test are menirea să măsoare un randament, va fi stabilit un standard de reuşită. Acest standard este un criteriu. În educaţie se foloseşte frecvent media cumulată drept criteriu. Asta nu înseamnă că nu pot fi folosite şi alte criterii ca: aptitudinea de integrare, de analiză de evaluare, cultura generală, capacitatea de adaptare, manifestarea unei atitudini constructive în situaţii dificile. Este simplist să apelăm la un singur criteriu. Recurgerea la mai multe criterii ridică o problemă interesantă. Dacă criteriile sunt puternic interrelaţionate combinarea unora dintre ele nu aduce un aport prea mare decât dacă s-ar folosi unul singur, deoarece fiecare măsoară acelaşi lucru. Din potrivă, dacă criteriile sunt slab interrelaţionate nu este recomandat să le combinăm, deoarece ele măsoară aspecte diferite. Combinarea criteriilor ridică şi o altă problemă cunoscută sub numele de "dimensionalitate statistică". Ghiselli (1964), evidenţiază două probleme. Prima constă în faptul că un criteriu, considerat că fiind fundamental poate deveni impropriu în timp. Ceea ce este azi considerat ca o măsură valabilă a reuşitei poate să fie contestată în viitor. Aceasta este problema "dimensionalităţii dinamice". A doua problemă este cea a "dimensionalităţii individului", şi este legată de diferenţele individuale. Doi indivizi pot face aceeaşi muncă procedând în maniere total diferite dar amândoi fiind cotaţi la fel de bine. Specialiştii sunt astfel confruntaţi cu dilema: acceptăm două metode de muncă la fel de valide sau una este privilegiată în detrimentul alteia.

50

PSIHODIAGNOSTIC (I)

Caracteristicile unei măsuri - criteriu Astin (1964), face distincţia între criteriu şi măsura-criteriu. El consideră criteriul un concept general legat de randament Acest concept trebuie să fie exprimat în termeni operaţionali, conform unei măsuri care apoi permite determinarea validităţi unui test. De exemplu reuşita la universitate este un criteriu conceptual, iar media cumulată este o măsură - criteriu. Măsura - criteriu are mai multe caracteristici: ‚ caracteristică foarte importantă a măsurii - criteriu este pertinenţa sa, adică validitatea sa. Ea trebuie să reflecte şi să măsoare aspectele fundamentale ale criteriului conceptual. Media cumulată este o măsură - criteriu validă dacă reflectă şi măsoară corect aspectele importante ale reuşitei la universitate. Evaluarea pertinenţei unei măsuri - criteriu se face prin procedee raţionale şi calitative. Nu există un indice cantitativ eficace pentru exprimarea gradului de pertinenţă a unei măsuri criteriu. ‚ a doua caracteristică a unei măsuri - criteriu este fidelitatea sau constanţa măsurărilor. O măsură criteriu trebuie să fie constantă în timp indiferent de circumstanţe. O măsură - criteriu inconstantă nu poate fi pusă în relaţie cu alta, iar indicele relaţiei cu predictorul nu va semnifica nimic, indiferent de gradul acestuia. De exemplu, dacă folosim o măsură inconstantă pentru determinarea productivităţii unui muncitor, atunci în cazul unei zile bune productivitatea va fi mare şi vom supraestima valoarea sa, iar într-o zi proastă riscăm să subestimăm valoarea sa. Alegerea unei măsuri - criteriu este supusă la cel puţin două constrângeri: ¤ factorii care induc o eroare de măsurare trebuie controlaţi pentru că ei influenţează măsurile criteriu în acelaşi fel ca şi predictorii; ¤ dacă controlul acestor factori nu ne permite să obţinem o măsură stabilă este posibil să creştem stabilitatea alegând un număr mare de măsuri - criteriu sau alegând eşantioane în mai multe ocazii. ‚ A treia caracteristică a unei măsuri criteriu este absenţa contaminării. Măsurarea criteriului se va efectua în condiţiile în care factorii non pertinenţi nu pot influenţa scorurile. Contaminarea poate să apară uşor dacă măsura criteriu se prezintă sub forma unor scale de evaluare care sunt vulnerabile datorită efectului de halo sau a tendinţei de indulgenţă. Instrucţiuni foarte precise de forma unei descrieri detaliate a caracteristicilor de evaluat permite diminuarea riscului de contaminare. Thorndike (1971) atrage atenţia asupra unui factor major de contaminare. Este cazul în care scorul criteriu al unui subiect este influenţat de cunoaşterea de către evaluator a scorului la predictor a subiectului respectiv. Thorndike aminteşte şi de efectul acestui factor asupra randamentului la criteriu al subiectului, efect denumit "predicţie pentru sine". Mai mult, el semnalează două tipuri de contaminare între predictor şi criteriu. De exemplu, dacă dorim să cunoaştem dacă un test de lectură permite predicţia scorurilor la un test de atitudine faţă de matematică, măsura criteriu va fi scorul la destul de atitudine faţă de matematică. Dacă evaluatorul care atribuie aceste cote cunoaşte scorurile subiecţilor la testul de lectură (predictor), evaluările sale pot fi influenţate. Riscurile de contaminare sunt probabil mai ridicate dacă un elev a obţinut un scor ridicat la testul de lectură şi când el pare să aibă o atitudine negativă faţă de matematică. Subliniem că problema riscă să apară dacă un subiect obţine un scor mic la testul de lectură dar manifestă o atitudine favorabilă faţă de matematică. Soluţia, pentru evitarea acestei situaţii este de a evita ca evaluatorul să cunoască scorurile subiecţilor la variabila predictor. Menţionăm că cele mai bune măsuri - criteriu sunt cele care prezintă cât mai multe avantaje practice, care sunt simplu de folosit, care sunt disponibile şi mai puţin costisitoare. 51

CORNEL HAVÂRNEANU

Există mai multe categorii de măsuri - criteriu: Prima categorie constă în măsurarea directă a producţiei sau a randamentului: volumul de vânzări, numărul de clienţi pe oră sau pe zi, numărul de accidente pe lună sau pe an, numărul de erori pe unitate, media cumulată etc. A doua categorie este formată din randamentul la un test, cum ar fi rezultatul la un examen sau la testele administrate de serviciile de personal din întreprinderi: scalele de evaluare fac parte din această categorie. Subliniem că distincţia dintre cele două categorii nu este exclusivistă. De exemplu, media cumulată poate aparţine uneia sau alteia din cele două categorii, în funcţie de felul în care ea a fost obţinută. În cea de-a treia categorie, măsura - criteriu aparţine unui grup. Testele de personalitate şi în particular chestionarele de interese sunt considerate valide dacă permit o bună clasificare a indivizilor în grupuri bine precizate. Testele de aptitudini sunt valide dacă permit să distingem indivizii care vor reuşi faţă de cei care vor eşua într-o activitate sau într-un program de studii dat. A patra categorie este formată din măsurile - criteriu de natură statistică, cum ar fi coeficienţii de saturaţie, coeficienţii de discriminare sau cei de consistenţă internă. ÎN CONCLUZIE Un test nu poate fi mai bun decât criteriile folosite pentru stabilirea validităţii, pentru că toate slăbiciunile criteriilor se răsfrâng asupra testului şi îi limitează utilitatea. Dificultatea nu constă în alegerea unei măsuri - criteriu pertinente, ci în faptul de a nu alege doar una. Pentru ca procesul de validare să fie valabil este necesar să recurgem la mai multe măsuri criteriu. V.5. METODE PENTRU DETERMINAREA VALIDITĂŢII PREDICTIVE Există patru metode principale pentru determinarea validităţii predictive, fiecare având avantaje diferite. Toate permit calculul unui indice cantitativ a relaţiei dintre predictor şi criteriu. Aceste metode sunt: 1. indicele de eficacitate 2. scorurile de separare a categoriilor 3. indicele de separare a grupurilor 4. indicele de utilitate (coeficientul de validitate) Coeficientul de validitate Aceasta este folosit pentru a determina validitatea predictivă. Metoda constă în a calcula corelaţia dintre scorurile la testul predictor şi scorurile la măsura - criteriu. Calculul presupune parcurgerea a cinci etape distincte: 1. alegerea unui eşantion de subiecţi; 2. aplicarea testului predictor acestor subiecţi; 3. realizarea unor prelucrări specificate dacă este cazul; 4. Colectarea datelor la criteriu; 5. calcularea corelaţiei între scorurile obţinute la predictor şi la criteriu; Coeficientul de corelaţie astfel obţinut este un coeficient de validitate. El este notat cu rxy, unde r este coeficientul de corelaţie, X predictorul şi Y criteriul. Este evident că toţi factorii care influenţează coeficientul de corelaţie pot influenţa coeficientul de validitate şi că datele trebuie să respecte postulatele necesare calculării coeficientului de corelaţie. Doi factori, care sunt de fapt postulate necesită o atenţie deosebită. 52

PSIHODIAGNOSTIC (I)

În primul rând ştiindu-se că coeficientul de corelaţie Pearson este cel mai des folosit, postulatul de liniaritate dintre două variabile este primordial. Dacă mai multe variabile sunt considerate ca fiind în relaţie liniară este necesar să verificăm această legătură înainte de a calcula coeficientul de corelaţie. Pentru a realiza această verificare vom trasa graficul produs de cele două variabile, fiecare axă reprezentând una din cele două variabile. Dacă relaţia nu este liniară atunci vom transforma scorurile într-o scală sau vom folosi o altă metodă de corelaţie pentru a estima coeficientul de validitate. În al doilea rând vom lua în consideraţie întinderea diferenţelor individuale. Se ştie că o mică variabilitate a scorurilor limitează valoarea pe care o poate avea un coeficient de corelaţie. Această este o problemă majoră pentru studiul validităţii, când folosim mai multe grupe de subiecţi. Este preferabil să folosim grupe eterogene, care prezintă o întindere mai mare a diferenţelor individuale. Interpretarea coeficientului de validitate Există mai multe forme de interpretare a unui coeficient de validitate. O primă formă constă în a compara diferiţi coeficienţi şi de a alege testul care prezintă coeficientul cel mai ridicat pentru o situaţie dată. O altă formă de interpretare este transformarea coeficientului de validitate în procente de varianţă. Prin ridicarea la pătrat a coeficientului de validitate obţinem proporţia din varianţă explicată prin acesta. Astfel, dacă rXY = 0,60 atunci r2XY = 0,36 sau o proporţie de varianţă egală cu 0,36. Putem spune că 36% din varianţă este împărţită între două variabile, sau că 36% din varianţa criteriului este datorată variaţiei scorurilor testului predictor. Observăm că coeficientul de validitate trebuie să fie de circa 0,7071 pentru ca jumătate din varianţa criteriului să fie explicată prin varianţa scorurilor la predictor. În majoritatea studiilor găsim raportări inferioare valorii 0,7071. Wiggins (1974) prezintă un exemplu în care studiază relaţia posibilă între scorurile la un test care măsoară dominanţa şi percepţia subiectului ca un leader, şi raportează un coeficient de validitate de 0,61. Aceasta înseamnă că indivizii care au obţinut un scor ridicat la testul de dominanţă sunt percepuţi ca lideri faţă de cei care prezintă scoruri mici. Autorul estimează că circa 37% din varianţa variabilei leader poate fi prezisă pe baza scorurilor la testul de dominanţă. Mai mult, el subliniază că de fapt există trei interpretări posibile prin utilizarea unor diagrame după metoda lui Cattell (1957). b c a leader

dominanţă

dominanţă

leader

dominanţă leader

Fig. 2 În fig.2a toate elementele dominanţei sunt conţinute în leader, în b toate elementele leader sunt conţinute în dominanţă, în c, 61% din elementele leader sunt comune cu cele ale dominanţei şi viceversa şi sunt dimensiunile unei trăsături-sursă numită extraversiune. În realitate, este mai plauzibil să cauţi predicţia posibilităţii de a fi perceput ca un leader pe baza scorurilor obţinute la un test de dominanţă. Aceasta ne face să presupunem ca în fig. a, că dominanţa este o componentă majoră a leaderului acoperind 37% din varianţa explicată. Conform diagramei b

53

CORNEL HAVÂRNEANU

presupunerea este inversată. Diagrama sugerează mai degrabă că leaderul va fi o componentă majoră a dominanţei. Diagrama c lasă să se presupună că chiar dacă 61% dintre elementele ambelor variabile sunt comune, influenţa unei a treia variabile, comună celorlalte două intră în joc. Wiggins (1974), sugerează o interpretare conform căreia dominanţa şi leaderul ar fi manifestări ale unei caracteristici mult mai profunde, ca extraversiunea. Acest exemplu ilustrează complexitatea interpretării unei relaţii între un predictor şi un criteriu. O a treia formă de interpretare a unui coeficient de validitate ţine seama de caracteristicile grupului care a fost ales, dacă testul este folosit pentru realizarea unei selecţii (Brogden, 1946). Autorul demonstrează că pe baza postulatelor, coeficientul rxy poate fi interpretat direct ca fiind o măsură a eficacităţii predictive, ca un raport între media scorurilor obţinute la măsura - criteriu a grupului selecţionat şi cele ale tuturor grupelor de candidaţi neselecţionaţi. De exemplu, să presupunem că 200 de candidaţi se prezintă pentru admiterea la un program de studii la care nu pot fi admişi decât 75, care să fie cei mai buni. Cel mai bun procedeu este de a accepta toţi candidaţii, pentru un timp şi apoi să procedăm la colectarea datelor - criteriu, pentru a selecta în final acei candidaţi care scorurile - criteriu cele mai ridicate. Media scorurilor - criteriu a grupului selectat va fi mai ridicată decât toate mediile pe care le putem calcula pornind de la fiecare combinaţie de 75 de candidaţi din cei 200 care s-au prezentat. Acest procedeu este bun din punct de vedere teoretic, dar în practică este imposibil de aplicat. Este rezonabil să aplicăm un test pentru selecţie şi să alegem 75 de candidaţi care au obţinut scoruri ridicate la test. Coeficientul de validitate, după cum sugerează Brogden, este egal cu raportul între randamentul mediu la criteriu, obţinut de grupul de 75 de candidaţi admişi pe baza testului predictor şi randamentul mediu obţinut de 75 de candidaţi care ar fi fost aleşi dacă făceam selecţia pe baza scorurilor - criteriu. Presupunem că obţinem un raport rxy = 0,80, ceea ce semnifică că grupul ales pe baza testului predictor va avea un scor criteriu mediu egal cu patru cincimi din cel al grupului selectat pe baza scorurilor criteriu. Metoda porneşte de la presupunerea că toţi candidaţii obţin un scor criteriu, ceea ce în practică este imposibil. O altă metodă de interpretare a coeficientului de validitate constă în predicţia erorilor. Aceasta presupune utilizarea ecuaţiei de regresie. Exemplu de calcul al coeficientului de validitate Să presupunem că prezentăm unui grup de 250 subiecţi un test, sub forma unei scala de măsurare a nivelului de cultură generală. Scorurile la test sunt prezentate sub formă de note standard STEN (standard ten) de la 1 la 10. Apoi, după un timp li se prezintă o scală de evaluare a atitudinii (gradul de satisfacţie) faţă de introducerea unei noi specialităţi în programul de studiu. Este a scală cu 7 trepte în care 1 înseamnă o atitudine foarte defavorabilă iar 7 o atitudine foarte favorabilă. Scorurile obţinute la această scală constituie măsuri criteriu în acest exemplu. Rezultatele celor două variabile sunt prezentate sub formă de frecvenţe în tabelul următor:

54

PSIHODIAGNOSTIC (I)

Măsura-criteriu (Y) 7 6 5 4 3 2 1 Σ

1

6 9 7 4 26

2

Scorurile la testul predictor (X) 3 4 5 6 7 8

4 12 18 3 37

2 12 10 11 5 40

2 21 4 6 4 37

4 13 2 6 2 27

9

2 8 9 3 2

4 19 5 1 1

2 5 7 1

3 5 1

24

30

15

9

10 4 1

5

Σ 4 12 45 74 42 51 18 250

Rezumatul statistic: ΣX = 1108 ΣX2 = 6324 Xmed = 4,432 SX = 2,3776 ΣY = 883 ΣY2 = 3601 Ymed = 3,532 SY = 1,3888 ΣXY = 4460 Este suficient să calculăm coeficientul de corelaţie între X (scorurile obţinute la testul de cultură generală) şi Y (scorurile obţinute la scala de atitudine) pentru obţinerea coeficientului de validitate.

rXY =

N ∑ XY − ∑ X ∑ Y N∑ X2 −

(∑ x )

2

N ∑Y2 −

(∑ Y )

2

=

1115000 − 978364 136636 = = 0,662 (594,4207) × (347,2189) 206394,13

Putem interpreta acest coeficient în proporţii sau în procente de varianţă explicată (0,6622 = 0,438). Putem spune că circa 44% din varianţa criteriului poate fi prezisă sau explicată prin varianţa scorurilor obţinute la testul predictor. Acest procent de varianţă explicată este relativ ridicat comparativ cu ceea ce întâlnim în general în studiile de validitate. Nu este simplu să stabilim cauzele rezultatelor foarte ridicate în studiile de acest tip. Totdeauna, putem afirma că acest coeficient a fost obţinut pe un grup la care nu s-a făcut o preselecţie, ceea ce presupune ca am folosit toţi subiecţii care au fost disponibili. Particularitatea acestora este aceea că permit o întindere maximă a scorurilor la testul predictor, ceea ce are ca efect creşterea valorii coeficientului de corelaţie.

V.6. VALIDITATE DE CONŢINUT Dacă un profesor doreşte să evalueze cunoştinţele studenţilor la o materie el va construi un test în care întrebările să cuprindă un eşantion reprezentativ a întregii materii. El se confruntă cu problema validităţii de conţinut, care se referă la gradul de reprezentativitate a eşantionului de întrebări. Problema constă într-o analiză raţională a conţinutului testului şi se realizează prin intermediul judecăţilor de valoare. Decizia este subiectivă şi nu există un indicator numeric. Specialiştii consideră că există două tipuri de validitate de conţinut: validitate aparentă şi validitate logică. Validitatea aparentă se realizează prin analiza testului, efectuată de un expert care concluzionează dacă acesta măsoară adevărate trăsătură pe care şi-a propus s-o măsoare. Acest tip de validitate nu este cea mai importantă deoarece putem folosi alt tip de validitate mai pertinent.

55

CORNEL HAVÂRNEANU

Validitatea logică în care eşantionul de itemi este stabilit într-o manieră mult mai concretă decât în cazul validităţii aparente. În acest caz se prezintă un tabel cu specificaţiile care conţin o definiţie clară a aspectelor măsurate, obiectivele precise şi alegerea cât mai logică a itemilor pentru o divizare coerentă a domeniului vizat. Tabelul care urmează prezintă un exemplu cu specificaţiile pentru măsurarea cunoştinţelor acumulate în legătură cu proprietăţile fizice ale pădurii:

SUBIECT Structura arborilor Transformarea arborilor Caracteristicile esenţelor Calculul cantităţilor Total

OBIECTIVE PARTICULARE Cunoştinţe Cunoştinţe Cunoştinţe despre despre specifice categorii metode 10% 0 0 10% 0 20% 20% 15% 0 0 10% 0 40% 25% 20%

Aplicaţii

Total

0 0 10% 5% 15%

10% 30% 45% 15% 100%

V.7. VALIDITATEA TEORETICĂ Începând cu anul 1955, Cronbach şi Meehl s-au ocupat de studierea validităţii teoretice propusă de Asociaţie Psihologilor din America (APA) în anul precedent. Validitatea teoretică este azi definită ca fiind un indicator al gradului în care un test măsoară constructul pe care se presupune că-l măsoară. Altfel spus, acest tip de validitate este utilă deoarece un test este construit pentru măsurarea unei caracteristici pe care subiecţii o posedă în diferite grade. Constructul este descris printr-o definiţie operaţională care precizează indicatorii observabili şi mijlocul prin care aceştia pot fi măsuraţi. Deseori un test nu poate măsura toate aspectele constructului deoarece definiţia acestuia conţine elemente foarte complexe şi vagi. Din această cauză validitatea teoretică este stabilită printr-o acumulare de evidenţe decât printr-un singur indice. Specialiştii în măsurare se bazează pe teoria referitoare la trăsătura măsurată şi fac predicţii asupra comportamentului la test într-o multitudine de situaţii. Aceste predicţii sunt verificate experimental şi dacă se dovedesc a fi exacte duc la concluzia validităţii teoretice a testului. Dacă ele sunt false sau insuficient de exacte sunt mai multe explicaţii: sau experimentarea nu a fost bine realizată, sau teoria care stă la baza construcţiei testului este falsă sau testul nu măsoară constructul respectiv. Pentru stabilirea validităţii teoretice toate sursele de predicţie pot fi folosite şi verificate empiric. Următoarele elemente pot constitui criterii de evidenţiere a validităţii teoretice: toate informaţiile referitoare la natura itemilor testului, omogenitatea testului, stabilitatea tuturor condiţiilor de aplicare, date referitoare la validitatea de conţinut şi validitatea predictivă, predicţiile referitoare la diferite grupuri, modificarea rezultatelor în timp, corelaţiile dintre construct şi diferite variabile demografice şi procedeele de măsurare folosite de test. Validitatea teoretică a unui test poate fi cunoscută în diferite moduri în funcţie de problema care se pune. De exemplu putem fi interesaţi de proporţia de varianţă observată care decurge din variabila măsurară de test sau de măsura în care randamentul la test coincide cu gradul de prezenţă a caracteristicii pe care presupunem că o măsurăm.

56

PSIHODIAGNOSTIC (I)

Pentru realizarea acestor constatări există posibilitatea folosirii mai multor metode: metode intratest, metode intertest, metode criteriale, manipulări experimentale şi studii de generalizabilitate etc. Metodele intratest vizează stabilirea validităţii de conţinut în funcţie de definiţiile operaţionale ale constructului şi studii de omogenitate a testului cu ajutorul indicelui de consistenţă internă, prin determinarea fie a coeficientului alpha fie a coeficientului Kuder-Richarson. Metodele intertest studiază corelaţiile dintre mai multe teste pentru a verifica dacă ele măsoară acelaşi construct. Este vorba de a stabili validitatea congruentă corelând scorurile obţinute la noul test cu cele ale unui test bine cunoscut. Dacă corelaţia este ridicată, putem presupune că noul test măsoară acelaşi construct ca şi testul deja recunoscut pentru calităţile sale de măsurare. Aceste metode folosesc şi studiile de analiză factorială, tehnică statistică utilizată pentru a determina numărul de factori, pe baza cărora putem explica intercorelaţiile unui ansamblu de teste. Tehnica permite determinarea numărului de factori şi explică mai bine scorurile obţinute la fiecare din teste precizând gradul de varianţă între scorurile explicate de fiecare factor (cât la sută din varianţa totală este acoperită de varianţa fiecărui factor). Testele care au în comun o varianţă ridicată sunt cele care măsoară acelaşi construct. Dacă această tehnică este folosită pentru a studia validitatea, putem vorbi de validitate factorială ca un aspect al validităţii teoretice. Pentru exemplificare prezentăm în tabelul de mai jos şase subteste, componente ale aceluiaşi test: 1.Reprezentare spaţială 2. Raţionament 3. Vocabular 4. Simţ mecanic 5.Percepţia dimensiunilor 6. Logică verbală

1 1,00

2 0,37 1,00

3 0,27 0,37 1,00

4 0,47 0,46 0,31 1,00

5 0,59 0,42 0,27 0,52 1,00

6 0,35 0,43 0,63 0,42 0,37 1,00

Constatăm că reprezentarea spaţială, măsurată cu ajutorul testului este relativ în legătură cu percepţia dimensiunilor (r = 0,59), iar rezultatele la proba de vocabular sun în legătură cu cele de la logică verbală (r = 0,63). Se observă prezenţa a doi factori principali iar testul format din şase subteste măsoară în realitate doi factori. O analiză factorială prin metoda componentelor principale (Hotteling) şi a rotaţiei factorilor prin metoda varimax permite următoarele constatări. Datele sunt prezentate în tabelul de mai jos. 1. Reprezentare spaţială 2. Raţionament 3. Vocabular 4. Simţ mecanic 5.Percepţia dimensiunilor 6. Logică verbală

FACTOR 1 0,78 0,54 0,11 0,73 0,84 0,27

FACTOR 2 0,12 0,46 0,89 0,29 0,15 0,84

Numerele prezentate în tabel reprezintă coeficienţii de saturaţie, care sunt interpretaţi ca coeficienţi de corelaţie între factori şi variabile. Testul original este considerat un test de aptitudini pentru studii secundare. Dar rezultatele analizei factoriale arată evident că sunt două teste omogene fiecare măsurând un construct. Primul este compus din itemi care măsoară reprezentare spaţială, simţul mecanic şi percepţia dimensiunilor. Acest construct poate fi numit "aptitudini pentru ştiinţe tehnice". Al doilea test este compus din itemi care măsoară vocabularul şi logica verbală, iar constructul măsurat poate fi numit "aptitudine verbală". 57

CORNEL HAVÂRNEANU

Altă abordare, folosită în contextul metodelor interteste, constă în studierea validităţii convergente şi divergente, propusă de Campbell şi Fiske. Validitatea convergentă permite să demonstrăm că două teste măsoară acelaşi construct, în timp ce validitatea divergentă constă în a demonstra independenţa sau lipsa de corelaţie a unui test cu alte teste care măsoară un construct diferit. Studiile de validitate predictivă, care vizează stabilirea legăturii dintre predictor şi criteriu, adică predicţia criteriului pe baza scorurilor obţinute la test, sunt indicatori buni ai constructului măsurat de test. Această tehnică este deseori folosită pentru construirea inventarelor de interese generale sau profesionale şi a testelor de personalitate. În aceste teste trebuie introduşi itemi care diferenţiază cu adevărat grupurile şi care vor permite descrierea psihologică a subiecţilor după randamentul la test. Studiile de generalizabilitate sunt foarte complexe, dar în acelaşi timp foarte complete. Un model este studiul de validitate "multitrăsături-multimetode" propus de Campbell şi Fiske. Această tehnică se bazează pe principiul în baza căruia un test măsoară un construct folosind o metodă particulară. Rezultatele la test pot fi dependente de constructul măsurat, de metoda utilizată sau de combinaţia celor două. Deci, dacă vom compara trăsătura care ne interesează cu alte trăsături, folosind diferite metod, rezultatele pot fi variabile. Este vorba de fapt de studierea validităţii convergente, a validităţii divergente şi a omogenităţii testului. De exemplu, dacă cu ajutorul a trei teste măsurăm trei trăsături, respectiv gradul de liberalism (A), cultura generală (B), şi alienarea (C), aplicând aceluiaşi grup de subiecţi trei metode diferite: metoda (I), cu răspunsuri la alegere, metoda (II), prin care se cere să se răspundă cu adevărat şi fals şi metoda (III), care presupune completare de fraze obţinem următoarele rezultate:

MET I MET II MET III

Trăsături A1 B1 C1 A2 B2 C2 A3 B3 C3

A1 0,87 0,64 0,28 0,71 0,25 0,11 0,70 0,27 0,09

METODA I B1 C1 0,80 0,31 0,58 0,66 0,22 0,30 0,66 0,12

0,82 0,27 0,32 0,72 0,08 0,09 0,67

A2

0,85 0,61 0,43 0,68 0,57 0,19

METODA II B2 C2

0,78 0,32 0,52 0,70 0,24

0,79 0,37 0,28 0,64

A3

0,81 0,65 0,47

METODA III B3 C3

0,79 0,38

0,80

Acest tabel prezintă pe diagonala principală coeficienţii de fidelitate. Se observă că pentru metoda (I) fidelitatea pentru cele trei teste este de 0,87, 0,80 şi respectiv 0,82. Din tabel putem desprinde patru categorii de rezultate: Prima categorie este evidenţiată de diagonala principală unde sunt prezentate estimările fidelităţii pentru fiecare test şi pentru fiecare metodă (acelaşi test, aceeaşi metodă). Observăm că aceşti coeficienţi au valori ridicate şi stabile. A doua categorie este formată din corelaţiile dintre trăsături diferite măsurate prin metode diferite. Aceste sunt corelaţiile: rA1, B2 = 0,25, rA1, C2 = 0,11, rB1, C2 = 0,22, rA1, B3 = 0,27, rA1, C3 = 0,09, rB1, C3 = 0,12,

58

PSIHODIAGNOSTIC (I)

rA2, B3 = 0,57, rA2, C3 = 0,19, rB2, C3 = 0,24, rB1, A2 = 0,58, rC1, A2 = 0,27, rC1, B2 = 0,32, rB2, A3 = 0,52, rC2, A3 = 0,37, rC2, B3 = 0,28, rB1, A3 = 0,30, rC1, A3 = 0,08, rC1, B3 = 0,09. Toate aceste valori ajută la studierea validităţii divergente, care este foarte mică faţă de corelaţiile aceeaşi trăsături măsurată prin metode diferite (rA1, A2 = 0,71). A treia categorie este formată din corelaţiile dintre diferite trăsături măsurate prin aceeaşi metodă: rA1, C1 = 0,28, rB1, C1 = 0,31, rA2, B2 = 0,61, rA2, C2 = 0,43, rA1, B1 = 0,64, rA3, B3 = 0,65, rA3, C3 = 0,47, rB3, C3 = 0,38, rB2, C2 = 0,32. Aceste corelaţii sunt măsuri ale varianţei care decurge din metodele folosite. A patra categorie este formată din corelaţiile dintre aceeaşi trăsătură şi diferite metode: rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64. Aceşti coeficienţi sunt folosiţi pentru studierea validităţii convergente. Pe baza acestor rezultate putem face următoarele constatări: 1. Coeficienţii de fidelitate trebuie să aibă valori ridicate, la fel şi corelaţiile aceleiaşi trăsături măsurate prin diferite metode(vezi diagonala principală şi corelaţiile rA1, A2 = 0,71, rB1, B2 = 0,66, rC1, C2 = 0,72, rA2, A3 = 0,68, rB2, B3 = 0,70, rC2, C3 = 0,64). Mai mult coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mult mai mari decât corelaţiile dintre trăsături diferite măsurate prin aceeaşi metodă (rA1, A2 = 0,71 mai mare faţă de rB1, A2 = 0,58 şi de asemeni mai mare decât rC1, A2 = 0,27 etc.). Altfel spus diferenţele dintre trăsături trebuie să fie mult mai importante decât diferenţele dintre metode. 2. Coeficienţii de corelaţie ale aceleiaşi trăsături măsurate prin diferite metode trebuie să fie mai mari decât corelaţiile dintre trăsături diferite măsurate prin metode diferite (rA1, A2 = 0,71 mai mare faţă rA1, B2 = 0,25, şi de asemeni mai mare decât rA1, C2 = 0,11 etc). 3. Corelaţiile dintre trăsături diferite trebuie să fie mici (rA1, C1 = 0,28), şi corelaţiile dintre trăsături diferite trebuie să fie foarte mici faţă de corelaţiile faţă de măsurile aceleiaşi trăsături (rA1, C1 = 0,28 mai mic faţă de rA1, A2 = 0,71). Vom spune că există validitate convergentă dacă obţinem corelaţii ridicate între măsurile aceleiaşi trăsături obţinute prin diferite metode (rA1, A2 = 0,71, rA1, A3 = 0,70) şi există validitate divergentă dacă obţinem corelaţii scăzute între trăsături diferite măsurate prin aceiaşi metodă (rA1, C1 = 0,28). Efectul metodei este relevant dacă corelaţiile testele care măsoară trăsături diferite sunt mai ridicate pentru aceiaşi metodă decât pentru metode diferite. De exemplu putem vorbi de un efect al metodei dacă rA1, C1=0,28 sau rB1, C1=0,31 sunt mai mari decât rA1, C2=0,11 şi rb1, C2=0,22. În acest caz putem vorbi de un "efect de halo" metodologic care se manifestă prin tendinţa de supraestimare a corelaţiilor dintre variabilele măsurate prin aceleaşi metode. Specificăm că în contextul validităţii de construct fidelitatea testului este definită ca fiind gradul de concordanţă dintre două măsurări a aceleiaşi trăsături cu aceiaşi metodă, iar validitatea este definită prin gradul de concordanţă între două măsurări ale aceleiaşi trăsături prin metode diferite.

59

CORNEL HAVÂRNEANU

VI. STANDARDIZAREA TESTELOR VI.1. SEMNIFICAŢIA STANDARDIZĂRII Standardizarea unui test presupune respectarea unor norme. Normele sunt seturi de scoruri obţinute de subiecţii eşantioanelor studiate. Standardizarea este importantă pentru că permite interpretarea psihologică a scorurilor şi pornind de la aceasta se pot face interpretări. Să presupunem că un subiect obţine la un test de inteligenţă scorul 10. Dacă scorul de 10 a fost obţinut doar de 2% din subiecţii populaţiei generale, se situează în topul celor mai bune scoruri, este evident că acea persoană are un nivel ridicat de inteligenţă. Dacă însă scorul de 10 se plasează la extrema cealaltă, cu cele mai mici scoruri (după scorurile obţinute de 98% dintre subiecţi) putem spune că subiectul are un nivel scăzut de inteligenţă. Fără existenţa normelor este imposibil să cunoaştem semnificaţia scorului. Standardizarea testelor este esenţială. Ea este folosită pentru utilizarea practică a testelor, cum ar fi în luarea unor decizii în ceea ce priveşte orientarea profesională şi selecţia personalului. Normele sunt necesare şi atunci când testele sunt utilizate pentru un scop precis, cum ar fi de exemplu selecţia militarilor care vor participa la o anumită operaţiune armată. Există o aplicaţia a testelor în care standardizarea nu este importantă, şi anume în analiza psihometrică a diferenţelor individuale - studiul ştiinţific al atributelor umane, abilităţilor, personalităţii, motivaţiei şi dispoziţiei. Pentru aceste aplicaţii psihometrice ale teoriei psihologice, scorurile brute, directe sunt satisfăcătoare, iar transformarea lor în norme ar duce la pierderea de informaţii. VI.2. PROBLEME ALE STANDARDIZĂRII Normele folosite pentru interpretarea semnificaţiei scorurilor unui test trebuie să fie precise. Dacă, conform normelor, un scor este obţinut de primii 20% dintre subiecţii populaţiei acesta poate sau nu să fie reprezentativ pentru norma grupului. Dacă normele nu sunt clare, ele pot duce la o interpretare greşită. Acest pericol apare în domeniul clinic şi psihiatric, unde există teste care sunt folosite pentru stabilirea diagnosticului. Dacă un copil este orientat spre o anumită formă de educaţie pe baza scorurilor obţinute la teste, este important ca normele să fie clare. Înainte de a descrie tehnicile de standardizare şi varietatea normelor care pot fi utilizate considerăm că este necesar să facem o precizare. Faptul că tetele psihologice pot fi uşor standardizate ne dă posibilitatea să facem comparaţii precise cu normele grupurilor. Normele sunt necesare pentru tetele psihologice pentru că nu există un zero absolut al scărilor de măsurare. Multe forme de măsurare au un zero absolut, lungimea, greutatea pot fi măsurate cu o astfel de scală. Lipsa lui zero absolut ar face ca măsurarea să fie imprecisă şi neştiinţifică.

60

PSIHODIAGNOSTIC (I)

VI.3. EŞANTIONAREA ÎN STANDARDIZARE Eşantionarea este un factor crucial al standardizării unui test. Calitatea normelor depinde de adecvarea la eşantionul pe care acestea se bazează. În eşantionare sunt două variabile importante: mărimea şi reprezentativitatea. Eşantionul normativ trebuie să fie o bună reflectare a populaţiei pe care o reprezintă şi trebuie să fie suficient de mare pentru ca erorile standard ale statisticii descriptive, adică ale mediei, abaterii standard şi distribuţiei, să fie neglijabile. Pentru reducerea erorilor standard o mărime a eşantionului de 500 de subiecţi este mai mult decât adecvată. Reprezentativitatea eşantionului este independentă de mărimea acestuia. Totuşi un eşantion mic nu poate fi cu adevărat reprezentativ pentru o populaţie mare. Normele pentru o populaţie generală trebuie să fie realizate pe eşantioane foarte mari, pentru o reprezentare clară, dar pentru populaţii cu variaţii mici sau pentru grupurile omogene, aceste norme pot fi realizate pe eşantioane mai mici. De exemplu, pentru 5000 de profesori universitari, un eşantion de 500 de subiecţi este reprezentativ. Alegerea mărimii adecvate a eşantionului reprezentativ nu se face în manieră absolută. Eşantionul depinde de populaţie, de mărimea şi omogenitatea acesteia. Astfel, profesorii de chimie sunt mai omogeni decât populaţia de profesori în general şi ar putea fi reprezentată de un eşantion mic. Un eşantion mic dar reprezentativ este superior unuia mare dar nereprezentativ. O valoare mică a erorii standard nu are nici o valoare dacă valorile observate nu sunt clare. VI.4. METODE DE EŞANTIONARE O populaţie eterogenă este o populaţie generală, în care există mai multe subseturi de persoane care diferă unele de altele. Obţinerea unui eşantion pentru o populaţie generală este cea mai dificilă problemă de eşantionare, pentru că trebuie obţinut un eşantion reprezentativ pentru populaţia respectivă. a. Eşantionarea întâmplătoare / prin randomizate Un eşantion este întâmplător dacă există şanse egale ca orice individ să fie ales ca membru al eşantionului. Dacă eşantionul este suficient de mare acesta poate fi într-adevăr reprezentativ pentru populaţia pentru care a fost desemnat. Dacă nu cunoaştem care sunt categoriile importante ale populaţiei pentru care vrem să realizăm eşantionul, atunci eşantionul întâmplător este cea mai simplă metodă pentru a asigura reprezentativitatea. De exemplu, să presupunem că dorim să realizăm un eşantion al copiilor cu vârsta de 11 ani din Zair pentru a standardiza testele pentru această vârstă. Ca noi veniţi în ţara respectivă nu aven informaţii despre variabile importante care pot afecta învăţarea în şcoală, de acea un eşantion randomizat este cel mai indicat pentru a obţine un eşantion reprezentativ. În această situaţie se obţine o listă a şcolilor primare din zonele reprezentative pentru această ţară. Şcolile sunt numerotate şi se aleg la întâmplare numere pentru a selecta şcolile. Apoi toţi copii de 11 ani din aceste şcoli selectate vor fi testaţi. În acest caz testarea se realizează pe un număr fix de copii şi eşantionul va cuprinde aproximativ 1000 de copii. Acest exemplu ilustrează un aspect important al eşantionării întâmplătoare, şi anume asigurarea şanselor egale pentru toţi indivizii din populaţie pentru a fi selectaţi în eşantion. Este imposibil să obţinem o listă a copiilor cu vârsta de 11 ani şi aceasta, de fapt, este principala dificultate a

61

CORNEL HAVÂRNEANU

eşantionării întâmplătoare: cum obţinem o listă preliminară din care să realizăm ulterior eşantionare sau, în limbaj de eşantionare, cum definim populaţia. Definirea populaţiei Nu este suficient să definim teoretic o populaţie. Acest lucru pare uşor, de exemplu, populaţia Marii Britanii conţine toate persoanele care locuiesc în ţara respectivă. Este necesar să avem câteva definiţii operaţionale sau definiţii concrete. Ar fi nevoie de o listă, dar unde ar putea fi găsită? Dacă am reduce discuţia, pentru moment, doar la persoanele adulte nu am avea la dispoziţie nici o listă. Listele de vot sunt incomplete, cartea de telefon cuprinde numai o parte din populaţie. După cum se vede o definiţie operaţională a populaţiei generale nu este uşor de dat. Dacă dorim să stabilim norme speciale pentru teste, şi atunci este necesar să realizăm o eşantionare specială a populaţiei. Din nou definirea teoretică şi operaţională poate fi dificilă. Dacă dorim să facem un studiu al criminalităţii, este posibil să obţinem o listă a celor aflaţi în închisoare, să eliminăm ceilalţi delicvenţi, rămânând numai cei din închisori. Apoi vom alege la întâmplare eşantionul de criminali. În acest caz există posibilitatea de definire clară a populaţiei de criminali din închisoare. Dacă dorim să stabilim şi norme legate de aspectul schizofrenic, această listă nu este suficientă, deoarece va fi imposibil să desemnăm un eşantion reprezentativ din populaţia de criminali aflaţi în închisoare. Bazele pentru definirea populaţie pot fi variate. My Ghaian consideră că pentru a defini populaţia de copii din şcoală putem folosi fie o listă a copiilor fie o listă a şcolilor. Un eşantion randomizat plecând de la lista şcolilor este mai uşor de obţinut. Dacă aceste unităţi sunt prea mari se va la o eşantionare aleatorie a membrilor fiecărei dintre unităţi. Şcolile sunt unităţi suficient de mici pentru a putea fi folosite ca bază pentru realizarea unei eşantionări întâmplătoare a copiilor. Desemnarea unui eşantion dintr-o populaţie Procedura standard pentru a ne asigura că fiecare membru al listei va intra în eşantion este aceea de a folosi o listă de numere întâmplătoare. Fiecare individ din populaţie primeşte un număr care poate fi apoi extras din lista de numere. Această procedură poate fi realizată cu ajutorul computerului. Este posibilă selecţia eşantionului pe intervale sau prin fixarea proporţiilor de populaţie din eşantion, doar dacă poziţia subiecţilor din listă a fost randomizată. În concluzie, eşantionarea aleatorie se poate realiza doar dacă există o listă adecvată a populaţiei. Pentru a ne asigura că eşantionul este reprezentativ, acesta trebuie să fie suficient de mare. Aceasta înseamnă că folosirea eşantionării aleatorii pentru stabilirea normelor de standardizare este consumatoare de timp şi costă prea mult, fiind preferată eşantionarea stratificată. b. Eşantioanele stratificate Eşantionarea stratificată implică divizarea unei populaţii eterogene într-un număr de mai multe populaţii omogene, aceste eşantioane de populaţii omogene putând fi combinate pentru a o forma un eşantion reprezentativ al întregii populaţii. Deoarece populaţiile omogene implică eşantioane mici reprezentative, eşantionul stratificat este mai reprezentativ ca mărime în comparaţie cu eşantionul aleator. Reprezentativitatea eşantionului stratificat depinde de variabilele utilizate pentru stratificare. Dacă sunt folosite prea multe variabile eşantionul va fi foarte mare. Dacă sunt utilizate variabile greşite atunci eşantionul nu va mai fi reprezentativ. Există o regulă simplă pentru selecţia variabilelor de 62

PSIHODIAGNOSTIC (I)

stratificare: ele trebuie să fie corelate cu variabilele care sunt studiate şi trebuie să micşorăm numărul de stratificări. Câteva exemple vor clarifica aceste reguli: Pentru a ilustra problema obţinerii unui bun eşantion stratificat pentru populaţie, vom analiza normele testului de inteligenţă Lorge-Thorndike. Scorurile la test trebuie să fie corelate cu vârsta şi vom analiza cum autorii au eşantionat fiecare grup de vârstă. Definirea populaţiei: Comunităţile formează baza eşantionării. Pentru a obţine un eşantion reprezentativ al acestor comunităţi se va folosi o eşantionare stratificată. Variabilele de stratificare: Bazele stratificării sunt reprezentate de factorii care corelează cel mai înalt cu scorul la testul de inteligenţă, în comunităţi: a. nivelul de cultură generală; b. proporţia diferitelor profesiuni; c. procentajul de proprietari de locuinţe; d. mediana valorii ratei la casă. Fiecare comunitate a fost clasificată în funcţie de aceste 4 variabile în 5 categorii de la foarte ridicat la foarte scăzut. Stratificarea eşantionului pe aceste baze s-a realizat pentru 44 de comunităţi şi fiecare copil din fiecare grup din eşantioanele comunităţilor a fost testat pentru stabilirea normelor. Rezultă un număr de 11.000 de subiecţi pentru fiecare grup, pentru vârste de la 6 la 17 ani, deci în total 136.000. Comentarii: Metoda de eşantionare trebuie să plece de la un eşantion reprezentativ al comunităţilor şi apoi de la un eşantion reprezentativ al copiilor pentru fiecare dintre comunităţile alese. Realizarea unui eşantion reprezentativ pentru o populaţie necesită selectarea unui număr mare de subiecţi, ceea ce implică costuri ridicate şi timp. O astfel de standardizare stă la baza construirii testelor. În acest caz stratificarea s-a bazat pe variabile care corelau ridicat cu inteligenţa. Dacă ar trebui să stabilim normele pentru un test de anxietate am folosi alte criterii de stratificare. Thorndike şi Lorge au folosit ca normă clasa socială pentru împărţirea pe subgrupe şi pentru a face comparaţia între ele. Aceste norme s-au dovedit a fi mai utile decât cele generale. Acest test este un bun exemplu pentru eşantionarea stratificată. Criteriul de stratificare nu este acelaşi pentru un test de anxietate. Vom examina în continuare eşantionul populaţiei generale pentru un test de personalitate “16 PF” (Cattell, Eber & Tatsuoka, 1970). Autorii a considerat că un eşantion mic, bine stratificat este superior unui eşantion randomizat. De aceea suntem interesaţi să examinăm cum autorii au standardizat acest test. Vom prezenta în continuare modul în care s-a realizat eşantionarea pentru subiecţii de sex feminin. Baza stratificării: SUA a fost divizată în opt arii geografice şi 8 densităţi ale populaţiei. Populaţia a fost împărţită în 5 grupe de vârstă şi 7 nivele de venit. Procentajul populaţiei pentru fiecare dintre aceste categorii a fost reflectat cât mai exact posibil în eşantionul de femei. Acest eşantion a fost de aproximativ 1000 de persoane. Comentarii: Se pare că planificarea din acest eşantion nu a fost bună. Nu toate categoriile sunt la fel de bine reprezentate. De exemplu, există doar 30 de femei din zonele muntoase şi 239 din două categorii 63

CORNEL HAVÂRNEANU

de oraşe cu populaţie peste 1 milion de locuitori. Acest eşantion nu este suficient de mare. După cum am precizat în cazul testului Thorndike-Lorge, 10.000 de cazuri ar fi necesare pentru a avea un eşantion stratificat reprezentativ. Eşantionul folosit pentru standardizarea inventarului “16PF” este prea mic pentru a face comparaţii semnificative între subgrupe. Un număr de 1.000 de subiecţi, oricât de bine stratificat ar fi eşantionul, nu este o bază de satisfacere pentru normele generale. Din aceste motive normele pentru acest test trebuie să fie tratate cu prudenţă. 1. 2. 3. 4.

5.

Reguli pentru normele generale un eşantion stratificat este mult mai eficient decât unul randomizat şi este mai bine să fie utilizat pentru testele standardizate; patru criterii de clasificare sunt normal suficiente. Dacă se folosesc prea multe criterii creşte mărimea eşantionului; variabilele care vor fi utilizate în stratificare trebuie să coreleze ridicat cu testul. Variabilele sex, vârstă şi clasă socială sunt importante; în fiecare grup ar trebui să fie suficienţi subiecţi pentru a forma un eşantion adecvat. Dacă luăm 300 ca minimum într-o categorie şi dacă avem, de exemplu, 5 clase sociale, 2 sexe şi 5 grupe de vârstă există deja 50 categorii de subiecţi, ceea ce înseamnă în total 15000 subiecţi; pentru a avea un eşantion adecvat pentru o populaţie generală este nevoie inevitabil de un număr mare de subiecţi.

c. Norme de grup speciale Deoarece în standardizarea testelor apar probleme logistice şi financiare mulţi “constructori” de teste preferă să folosească norme pentru grupele specifice pentru care testele sunt realizate. Pentru aceste grupuri specifice se aplică aceleaşi principii de eşantionare. Deoarece aceste grupe sunt mai omogene, eşantioanele reprezentative vor fi mai mici. Pentru a clarifica problemele standardizării testelor pentru grupuri specifice vom examina normele publicate de autorii anumitor teste. Scala conservatorismului (Wilson & Patterson, 1970). Această scală vizează măsurarea dogmatismului sau rigidităţii, descrise de Rokeach (1960) ca atitudine care are un efect profund în multe sfere ale vieţii, şi care poate fi observată în conflictele din Beirut şi Belfast. S-a folosit un număr mare de norme, dar în manualul testului nu sunt precizate şi motivele selecţiei acestora. În studiu au fost incluşi studenţi universitari din 4 ţări, studenţi din colegii de educaţie, muncitori calificaţi, subiecţi de sex feminin de vârstă şcolară şi de sex masculin de toate vârstele. Comentarii Examinând numărului de subiecţi pentru fiecare grup constatăm că aceste norme trebuie privite cu rezerve. Cel mai mare număr de subiecţi se găsesc în eşantionul ocupaţiilor din Noua Zeelandă 340 de subiecţi. Un eşantion cu o astfel de mărime nu este reprezentativ pentru varietatea profesiunilor. Au fost examinaţi 50 de studenţi din mai mult de 4 universităţi din Marea Britanie, multe dintre ele având mai mult de 5.000 de studenţi. Din aceste motive eşantionul de studenţi nu poate fi folosit ca bază pentru norme. Cele mai multe dintre eşantioane sunt prea mici pentru a fi reprezentative: 22 de tehnicieni de laborator, 22 de lucrători din biserică şi 30 de oameni de afaceri.

64

PSIHODIAGNOSTIC (I)

Concluzii Normele utilizate au o valoare prea mică şi nu pot fi folosite pentru interpretarea scorurilor la test. Alegerea grupelor este interesantă, dar era nevoie de un număr mai mare de subiecţi. Nu este posibil ca rezultatele obţinute de subiecţii acestor eşantioane să fie utilizate ca norme pentru o populaţie generală. Normele specifice grupului trebuie să aibă la bază un eşantion mai larg şi mai reprezentativ decât cel folosit în acest test. În 1970 Kline a dezvoltat Ai3Q, un test al personalităţii obsesive. S-au stabilit normele pentru diriginţii claselor a VI-a din Anglia. Obţinerea eşantionului Pentru a avea un eşantion reprezentativ al diriginţilor claselor a VI-a, autorii s-au asigurat mai întâi că au un eşantion adecvat al claselor a VI-a. Astfel, baza eşantionului a fost să se examineze toţi diriginţii claselor a VI-a dintr-un eşantion stratificat al claselor a VI-a. Acest lucru a fost foarte important. Un eşantion de diriginţi din şcoli cu clase numeroase de a VI-a şi standarde academice foarte ridicate, cum ar fi Manchester Grammar School, St. Paulus and Cheltenham Ladies, ar fi complet greşit dacă sar fi folosit ca bază pentru norme. Stratificarea variabilelor pentru şcoli Au fost utilizate 4 variabile de stratificare. Deşi unele din aceste variabile nu mai au aplicabilitate, ele reprezintă un exemplu bun pentru modul cum trebuie realizat un eşantion stratificat. 1. surse de finanţare: şcoli publice, susţinere directă sau de la stat; 2. sex: băieţi, fete, mixte; 3. localizare geografică: orăşele, oraşe mari, mediu rural; 4. sistemul claselor: şcoli de gramatică, şcoli comprehensive şi colegii de 6 clase. A fost destul de dificil să se realizeze un eşantion echilibrat ţinând seama de toate variabilele, deoarece există puţine şcoli publice de stat în oraşele mici, cel puţin în afara Londrei. Cu toate acestea un eşantion reflectând proporţiile acestor şcoli în populaţie, chiar dacă există doar două şcoli pentru fiecare categorie, ar asigura norme suficient de precise. Au fost listate toate şcolile pentru fiecare categorie şi au fost alese întâmplător două şcoli din fiecare categorie. Eşantionul obţinut conţinea aproximativ 1.000 de subiecţi de sex feminin şi 1.000 de subiecţi de sex masculin, acoperind doar nordul Angliei. Chiar dacă lucrăm cu categorii omogene de subiecţi din anumite zone geografice ale ţării, este nevoie de un eşantion mare pentru a fi reprezentativ. Myers-Briggs Type Indicator (Myers&Briggs, 1962). Acest test, care clasifică subiecţii în funcţie de categoriile lui Jung (extravertiţi intuitivi, extravertiţi raţionali, etc.) îl vom folosi pentru a ilustra unele dintre problemele eşantionării. Autorii acestui test au folosit un eşantion de 3.500 de băieţi şi 2.500 de fete din 37 de şcoli din Pennsylvania. Acest eşantion este reprezentativ pentru acest stat, dar normele pot să nu fie valabile pentru alte state. Autorii au folosit un eşantion de 4.500 de studenţi la arte şi inginerie din 8 universităţi, care la admitere cereau un nivel ridicat de calificare al studenţilor. Subiecţii din acest eşantion nu erau reprezentativi şi pentru studenţii altor colegii care nu aveau astfel de condiţie la admitere şi care, de fapt, sunt cele mai numeroase în SUA. Au fost folosite grupe normative neadecvate: copii adoptaţi (34 subiecţi de sex masculin şi 25 de sex feminin) şi 40 de arhitecţi nu nivel ridicat de creativitate.

65

CORNEL HAVÂRNEANU

Chiar atunci când investigatorii ştiu cum trebuie stabilite normele de grup, adesea aceştia nu reuşesc să le respecte deoarece nu au resursele de timp şi materiale necesare pentru aceasta. 1. 2. 3.

Reguli pentru eşantionarea grupurilor speciale stratificarea grupului în funcţie de variabilele care corelează ridicat cu testul; umărul minim pentru eşantioane este 300. Adesea este necesar să facem eşantionarea în timp; un eşantion mic, cum este în cazul scalei conservatorismului, este mai bun decât deloc. Dacă a fost utilizat un eşantion mic, utilizatorii testului trebuie să fie avertizaţi în legătură cu acest aspect. Normele bazate pe un eşantion mic sunt doar sugestive sau experimentale, ele pot şi complet greşite.

CONCLUZII În principal dificultăţile eşantionării nu sunt de natură teoretică sau intelectuală, ci practice ţinând de insuficienţa resurselor. Dacă un test este folosit pentru a lua decizii este esenţial ca normele să respecte standardele pe care le-am prezentat anterior. Un eşantion mare şi stratificat adecvat este esenţial pentru a avea norme bune. VI.5. EXPRIMAREA REZULTATELOR După ce grupurile normative au fost testate rezultatele trebuie să fie exprimate în formă numerică. Există mai multe modalităţi de a face acest lucru. Cele mai multe dintre metode compară scorul individului cu grupul normativ relevant. Norme diferite Vom descrie în continuare câteva dintre cele mai utilizate norme, precum şi avantajele şi dezavantajele lor. a. Centile Un centil este un scor a cărui procentaj este dat de grupul normativ. Al 30-lea centil este un scor sub care se găsesc 30% din subiecţii eşantionului. Acestea au avantajul că pot fi înţelese de subiecţii testaţi. Totuşi aceste norme au şi limite importante: a) Centilele sunt scoruri ordinale pentru care nu se pot calcula parametri statistici; b) Distribuţia centilelor este dreptunghiulară în timp ce distribuţia scorurilor testului se apropie de cea normală. De aceea în jurul mediei diferenţele între subiecţi sunt mici, în timp ce la extreme apar diferenţe mari între subiecţi. Deoarece centilele nu pot fi analizate statistic şi pentru că afectează scorurile brute, aceste norme nu sunt recomandate. Ele pot fi folosite doar pentru explicarea rezultatelor. b. Scoruri standard Cele mai utile norme sunt scorurile standard. Există o mare varietate de astfel de scoruri şi în continuare vom discuta despre cele mai frecvent utilizate.

66

PSIHODIAGNOSTIC (I)

Scorurile Z Scorurile standard se calculează prin împărţirea deviaţiei fiecărui scor de la medie la abaterea standard a scorurilor. Formala de calcul este următoarea: X−M Z= , unde

σ

Z - scorul standard; X - scorul obţinut la test; M - media distribuţiei scorurilor; σ - abaterea standard a scorurilor Abaterea standard a testului este măsura variabilităţii testului, cât de mult scorurile variază în jurul mediei. Proprietăţile scorurilor Z Cel mai mare avantaj al scorurilor Z în comparaţie cu notele brute, este că scorurile Z sunt întotdeauna echivalente. Astfel, un scor Z de 2 înseamnă întotdeauna 2 abateri standard de la medie. Ele permit compararea scorurilor obţinute la teste diferite. Să presupunem că avem un set de scoruri la un test la care media este 50, iar abaterea standard de 5. În tabelul următor prezentăm scorurile brute şi notele Z corespunzătoare, calculate după formula prezentată anterior: Scoruri brute 50 55 60 45 43

Scoruri Z 0 1 2 -1 -1,4

Scorurile Z au o medie de 0, o abatere standard de 1 şi pot lua valori negative şi pozitive. Un scor Z mai mare decât media este un scor pozitiv, iar scorul mai mic decât media este un scor Z negativ. Transformarea scorurilor brute în scoruri Z este liniară, astfel că distribuţia scorurilor brute este menţinută în scorurilor Z. Dacă distribuţia scorurilor brute este normal distribuită atunci scorurile Z vor avea valori între +3 şi -3. Deoarece suprafaţa curbei normale este cunoscută, scorurile Z normal distribuite au particularităţi informative. De exemplu, aproximativ 95% din distribuţia normală este plasată între 2 bateri standard de o parte şi de alta a mediei distribuţiei. Un scor Z de 2 poate fi interpretat în termeni de procentaj: 2% dintre subiecţi au rezolvat mai bine, celelalte 2 procente găsinduse la celălalt capăt al distribuţiei. Cu toate avantajele pe care le au scorurile Z, există două probleme majore, deşi acestea sunt cele mai simple forme ale scorurilor standard. a) O scală care are ranguri mici (de la -3 la +3) şi o medie de 0, are mai puţină semnificaţie, de aceea sunt mai puţin utilizate de către psihologi. b) Rezultatele la multe teste se distribuie mai mult sau mai puţin normal. Când distribuţia nu este normală distribuţia scorurilor Z nu poate şi transformată în centile. Pentru a depăşi aceste dificultăţi psihologii transformă scorurile Z în alte scoruri standard. 67

CORNEL HAVÂRNEANU

Scorurile Z transformate în alte scoruri standard Scorurile Z pot fi transformate în alte scoruri standard, atunci când se dă media şi abaterea standard. Aceste scoruri, la fel ca şi scorurile Z, sunt compatibile cu alte scoruri standard transformate cu aceeaşi medie şi abatere standard. Z t = a + bZ , unde Zt - scorul Z transformat a - media distribuţiei transformate b - abaterea standard a distribuţiei transformate Z - scorul Z După cum precizează şi Cronbach (1976), cel mai obişnuit scorurile Z sunt transformate în scoruri standard cu media 50 şi abaterea de 10. În tabelul de mai jos sunt date scorurile Z transformate după formula anterioară. Scoruri brute 55 60 45 43

Z 1 2 -1 -1,4

scoruri Zt 60 70 40 36

Scorurile standard normalizate Unii psihologi preferă scorurile standard normalizate. Inteligenţa, de exemplu, necesită să fie normal distribuită (Vernon, 1961). De aceea se utilizează scoruri standard normal distribuite. Pentru a normaliza un set de scoruri Z trebuie parcurşi mai mulţi paşi: a. să se calculeze proporţia cumulată a eşantionului pentru fiecare scor brut; b. calcularea frecvenţei cumulate pentru fiecare scor. Frecvenţa cumulată pentru scorul X este reprezentată de numărul de subiecţi care au cote sub X; c. poate fi calculată frecvenţa cumulată pentru valoarea din mijloc al fiecărui interval al scorului, adăugând la scor jumătate din numărul de subiecţi care au acel scor. Dacă frecvenţa cumulată a lui X este 10 şi 6 subiecţi au scorul X, atunci punctul din mijloc este 13; d. fiecare punct de mijloc al frecvenţei cumulate poate fi convertit într-o proporţie prin împărţire la N (numărul de subiecţi); e. în tabele statistice care arată suprafaţa curbei de distribuţie normală, aceste puncte de mijloc pot fi transformate în scoruri Z; f. aceste scoruri Z sunt normal distribuite şi se poate face referire la ele ca scoruri Zn; g. scorurile Z normalizate pot fi transformate în orice tip de scoruri standard, utilizând formula dată anterior. Scorurile T Buros (1972) consideră că dacă trebuie folosite scoruri standard normalizate, atunci trebuie folosită o scală care să aibă media 50 şi abaterea standard de 10. Alte scoruri standardizate normalizate a. Stanine. Acestea au media de 5 şi abaterea standard de 2. Aceste scoruri împart curba normală în nouă scoruri; b. Notele sten, au media de 5,5 şi abaterea standard de 1,5. Acestea au fost folosite în special pentru testele de personalitate şi împart curba în 10 scoruri; c. Testul de inteligenţă Wechsler utilizează o scală cu media de 100 şi abaterea standard de 15. 68

PSIHODIAGNOSTIC (I)

a. b. c.

a. b. c. d. e. f. g. h. i.

Utilizarea scorurilor standard normalizate Scorurile standard normalizate pot fi folosite în condiţii speciale: doar când distribuţia originală este aproximativ normală. Dacă această distribuţie nu este normală, vor rezulta erori, în special la extremele distribuţiei; trebuie utilizate atunci când există anumite aşteptări teoretice în legătură cu distribuţia normală; este esenţial ca grupul de standardizare să fie reprezentativ pentru distribuţie, pentru a reflecta cât mai exact populaţia, în special la extreme. Concluzii scorurile brute ale testelor psihologice au înţeles doar în relaţie cu scorurile normative ale grupului; valoarea normelor depinde de eşantionul sau eşantioanele care au fost folosite. Doar când aceste eşantioane sunt adecvate populaţiei, normele pot fi folosite fără rezerve; Există eşantioane foarte largi, uneori de 10.000 de subiecţi; Eşantioanele stratificate sunt mai eficiente decât cele randomizate, iar variabilele în funcţie de care eşantionul ar trebui stratificat corelează ridicat cu variabilele testului; Există multe metode de exprimare a scorurilor normative; Centilele nu sunt recomandate pentru că nu pot fi prelucrate statistic; Scorurile standard sunt recomandate, cele mai utile sunt scorurile standard cu media 50 şi abaterea de 10; Scorurile standard normalizate sunt recomandate numai în situaţii speciale. Dintre acestea scorurile T sunt cele mai utile; Orice test psihologic trebuie să respecte procedura de standardizare. Un set de scoruri standard poate duce la concluzii eronate dacă eşantionarea este deficitară. VI.6. METODE ALTERNATIVE DE INTERPRETARE A SCORURILOR LA TEST

Există metode de interpretare a scorurilor care diferă de norme şi au valoare doar în anumite circumstanţe. VI.6.1. Criteriu de conţinut Dacă un test solicită anumite deprinderi sau comportamente pentru a fi completat, este nevoie ca testul să reprezinte o măsură validă ipso facto a acestor deprinderi sau comportamente. De exemplu, dacă un test de muzică cere subiecţilor să recunoască acordul dominant într-o serie, subiecţii au abilităţi muzicale dacă aleg itemii corecţi. Validitatea conţinutului este relevantă când conţinutul este clar specificat. Acest lucru este relativ uşor de realizat pentru nivele elementare ştiinţifice, muzicale sau matematice, când conţinutul creşte progresiv în dificultate pentru a măsura nivele tot mai ridicate de cunoştinţe. Validitatea conţinutului se aplică mai mult în cazul testelor de cunoştinţe şi de abilitate. Am introdus termenul de conţinut valid deoarece criteriul de conţinut se aplică atunci când testele au fost construite în aşa fel încât să aibă un conţinut valid. De exemplu, pentru testarea notaţiei muzicale, un test ar trebuie să conţină toate notaţiile muzicale, cu toate că problema notaţiilor muzicale poate fi evaluată rapid în timpul execuţiei unei piese muzicale. Un scor de 100 percentile ar indica superioritate/deplină stăpânire, iar x % ar indica x % superioritate. În aceste teste este nevoie să se stabilească punctele de critice în funcţie de care să se decidă dacă elevul poate să îşi mai continue 69

CORNEL HAVÂRNEANU

cursul. În multe şcoli astfel de evidenţe empirice lipsesc, fiind înlocuite cu punctele de vedere arbitrare ale profesorilor. Dificultăţi ale metodei criteriului Problemele se pot datora restricţiilor metodei criteriului atunci când conţinutul nu este clar stabilit. Itemii testului trebuie să reprezinte un eşantion din universul de itemi. Din această cauză este dificil să argumentăm că un scor reprezintă cel mai bun procentaj pentru subiect. Aceasta înseamnă că acest criteriu de conţinutul poate fi utilizat doar pentru interpretarea scorurilor testului când există un conţinut specific slab sau ridicat al testului. CONCLUZI Criteriul de conţinut este potrivit doar pentru testele de cunoştinţe şi doar atunci când conţinutul poate fi clar definit. Pentru cel mai scăzut nivel educaţional al claselor primare un astfel de test poate fi valabil. Schonell (1951) a dezvoltat un set de teste diagnostice pentru citire când rezultatele indicau aspecte exacte, cum ar fi inversarea anumitor litere, confuzie între anumite litere. VI.6.2. Criteriul de predicţie O altă metodă de interpretare a scorurilor testului şi care nu ţine seama de norme este probabilitatea ca subiecţii, prin fiecare scor să reflecte un criteriu particular. Trebuie construit un tabel al aşteptărilor. Există câteva aspecte care trebuie notate. a. Tabelele de aşteptare pot fi construite doar când sunt posibile criterii clare ale scorurilor. Acest lucru este posibil doar pentru anumite teste din domeniul industrial şi educaţional. Examinarea scorurilor şi gradelor reprezintă un bun criteriu pentru tabele de expectanţe, deşi în şcoli şi universităţi examinările practice nu sunt eliberate de note. b. Aceste aşteptări nu sunt teoretice ci empirice. Aceasta înseamnă că în studiile realizate pe scară largă trebuie să avem o populaţie relevantă. Trebuie să avem în vedere problemele legate de eşantionare pentru stabilirea normelor. În acest sens tabelul probabilităţilor expectanţelor reprezintă date normative. c. Tabelul expectanţelor ilustrează o importantă dilemă a psihologiei aplicate şi psihometriei: utilizarea predicţiei reale în caz individual. Dacă un scor particular la un test indică 0,45 probabilitate pentru reuşită, aceasta înseamnă că 45% dintre indivizi (în eşantionul normativ) cu un astfel de scor, promovează examenul. În acest caz tabelele de expectanţă ne arată că 45% dintre subiecţii care au obţinut acest scor au reuşit la test. Un evaluator ar putea respinge toţi candidaţii cu un astfel de scor sau i-ar putea accepta pe toţi. Pentru cazurile individuale aceasta ar putea fi decizie incorectă. Aceasta este dilema psihologiei aplicate. Tabelele expectanţelor pot fi utilizate cu anumite rezerve. În construirea tabelului expectanţelor eşantionul poate fi divizat în funcţie de criteriul grupurilor reuşita/nereuşita fiind un criteriu obişnuit şi util. Scorurile testului sunt divizate astfel încât să existe un număr egal de indivizi pentru fiecare grup, cu excepţia extremelor, şi se calculează proporţia de subiecţi din fiecare grup care a reuşit sau nu la examen. Această proporţie reprezintă, probabilitatea ca indivizii cu aceste scoruri la test să reuşească la examen.

70

PSIHODIAGNOSTIC (I)

Dacă eşantionarea este săracă şi tabelul expectanţelor va fi cel mai probabil greşit. Este necesar de un eşantion larg şi reprezentativ pentru realizarea tabelului de expectanţe, dar această abordare prezintă câteva diferenţe faţă de standardizarea eşantionului. În locul stabilirii poziţiei relative a scorului subiectului în grupul normativ, tabelul expectanţelor stabileşte poziţia relativă a performanţei în funcţie de anumite criterii. VI.6.3. Metoda regresiei Scorurile ipsative Aceste scoruri apar în orice test cu răspunsuri forţate, în care fiecare alegere este cotată. De exemplu, în Testul Mecanismelor de Apărare (Gleser & Ihelevisch, 1969) subiecţii au de ales, pentru fiecare item, dintre cinci răspunsuri care reprezintă cinci mecanisme de apărare diferite, cele care sunt mai mult sau mai puţin probabile. Scorul testului reprezintă forţa relativă a capacităţii de apărare a individului. Trebuie să existe unele corelaţii negative între scoruri ca un artefact al sistemului de cotare, alegerea unui răspuns să însemne excluderea celorlalte patru. Acest sistem de cotare nu poate fi o măsură absolută a capacităţii de apărare. Un băutor poate considera whisky-ul ca băutura favorită, apoi ginul şi coniacul, combinaţia însă este selectată şi de un dipsoman. Aceste alegeri pot fi greu comparate. Utilizarea scorurilor ipsative pentru testele cu alegeri forţate are următoarele efecte. Mai întâi matricea de corelaţie nu are semnificaţie deoarece scalele sunt artificial corelate negativ. Analiza factorială a corelaţiilor nu poate fi interpretată. În al doilea rând realizarea normelor pentru aceste scale nu are sens, deoarece scorurile indivizilor nu pot fi comparate. Ar putea fi folosite normele bazate pe ranguri. Aceasta înseamnă că 60% dintre bărbaţi dau primul rang intereselor externe, interesul pentru broderie având ultimul rang. Acestea au totuşi o valoare îndoielnică pentru că distanţele dintre ranguri nu sunt cunoscute. Scorurile ipsative ale unui test sunt folosite ca bază de discuţie cu subiectul care a rezolvat testul. Aceasta înseamnă că rangurile scorurilor pot fi explicate. Utilizarea lor este restrânsă la contexte în care scorurile sunt utilizate ca bază de discuţie şi când cuantificările sunt relativ neimportante. Deci, aceste teste pot fi folosite în psihologia clinică, orientare profesională şi consiliere, când este important să există un raport de încredere între subiect şi examinator. CONCLUZIE Testele normative sunt superioare testelor ipsative deoarece au o precizie mai mare în măsurarea caracteristicilor psihologice. Scorurile ipsative sunt potrivite ca bază de discuţie. Este la fel de posibil ca şi testele normative să fie baze de discuţie, dar prezintă şi avantajul că fi analizate statistic, lucru care nu se poate realiza în cazul scorurilor ipsative, acesta fiind un motiv în plus ca ele să nu fie folosite.

71

CORNEL HAVÂRNEANU

VII. TESTELE DE INTELIGENŢĂ VII.1. CONTEXTUL ISTORIC AL TESTELOR DE INTELIGENŢĂ Testele de inteligenţă reprezintă unele dintre cele mai vechi teste psihologice. Binet şi Simon (1905) au dezvoltat aceste teste la Paris, descoperindu-se apoi avantajele lor pentru educaţie. Aceste teste au fost ulterior dezvoltate, devenind cele mai utilizate teste de inteligenţă cunoscute şi sub numele de Scala Standford Binet. În acelaşi timp Spearman (1904) a raportat prima analiză factorială a abilităţilor umane. Autorul consideră că abilităţile umane sunt explicate în termenii factorului g, un factor de abilitate generală, şi a factorilor specifici. Spearman a dezvoltat noţiunea de inteligenţă ca factor general, care reprezintă încă cea mai modernă încercare de măsurare a inteligenţei. Definiţie inteligenţei şi a factorului g Jensen (1980) menţionează că există un număr foarte mare de definiţii ale inteligenţei atât psihologice cât şi nepsihologice. Ascuţit, perspicace şi rapid sunt adesea termeni folosiţi în definiţie, opuşii lor fiind vag/neclar, lent/apatic şi încet. Astfel de definiţii sunt prea vagi pentru a avea utilitate ştiinţifică. Borring (1923) încearcă să depăşească această dificultate definind inteligenţa ca fiind ceea ce măsoară testele de inteligenţă. Această definiţie este circulară şi inutilă, fără posibilitatea de a defini precis şi clar ceea ce măsoară testele. Totuşi factorul măsurat de testele de inteligenţă poate fi definit. Aceste teste măsoară un factor, în mod obişnuit denumit „gf”, aptitudinea fluidă. Un factor poate fi definit prin variabilele care au pondere mare în acesta. Inteligenţa, dacă o considerăm ca fiind egală cu aptitudinea fluidă, poate fi obiectiv definită prin factorii care au pondere în aceasta. Astfel, inteligenţa poate fi văzută ca o abilitate raţională vastă şi de bază, utilă în soluţionarea unei mari varietăţi de probleme. Abilitatea de rezolvare a problemelor nu este specifică doar pentru testele de inteligenţă, aspect demonstrat de faptul că scorurile la testele de inteligenţă corelează cu alte criterii externe, cum ar fi succesul academic şi performanţa profesională (Jensen, 1980, Kline, 1990). Putem defini inteligenţa, măsurată de testele de inteligenţă, ca o abilitate raţională de bază a individului angajat în rezolvarea de probleme de diferite tipuri. Importanţa lui este atestată de faptul că întotdeauna apare un factor mai larg în orice analiză factorială a abilităţilor. Totuşi inteligenţa se manifestă prin deprinderi particulare care sunt valorizate prin cultură. Acest aspect al inteligenţei este definit prin factorul „gc” sau aptitudinea cristalizată, care este aptitudinea fluidă exprimată cultural. Pentru a înţelege mai bine ceea ce testele de inteligenţă dar şi alte teste de aptitudini sau abilităţi încearcă să măsoare vom prezenta în continuare structura factorială a abilităţilor.

72

PSIHODIAGNOSTIC (I)

Structura factorială a abilităţilor umane Structura abilităţilor umane a fost stabilită folosindu-se analiza factorială. Cattell şi Haktian (1974) au găsit o serie de factori ai abilităţilor primare: V - abilitatea verbală - înţelegerea cuvintelor şi ideilor. Cuprinde sarcini ca sinonime, înţelesul proverbelor, analogii. Este probabil cel mai bun indicator al inteligenţei cristalizate – gc; N - factor numeric - este uşurinţa în a manipula numerele. Acesta se distinge factorial de raţionamentul aritmetic; S - factorul spaţial - abilitatea de a vizualiza figuri bi şi tridimensionale atunci când orientarea lor este alterată; P - Viteza de percepţie şi factorul acurateţe - implică evaluarea figurilor atunci când perechile de stimuli sunt similare sau diferite; Cs - Viteza de închiderea - se referă la abilitatea de completare a gestaltului atunci când lipsesc părţi din stimuli. Viteza de închidere verbală corelează 0,61 cu fluenţa verbală, ceea ce sugerează că familiarizarea cu anumite cuvinte are un rol important pentru acest factor; I - raţionament inductiv - implică inducţia, raţionamentul plecând de la particular la general. Ma - memoria asociativă sau mecanică - se referă la memorarea perechilor de cuvinte între care nu există legătură. Aceasta corelează cu testul perechilor cuvânt-număr şi cu testul perechilor figurănumăr; Mk - abilitate şi cunoştinţe mecanice; Cf - flexibilitatea de închidere - implică ignorarea stimulilor irelevanţi din câmpul perceptiv pentru a găsi figurile stimul. Conform lui Cattell şi Haktian acest factor este o manifestare a independenţei şi este legat de factorul de personalitate independenţă. Ms - memoria span - este reamintirea de scurtă durată a literelor. A fost utilizată în testul WISC şi WAIS. Corelaţia între Ma şi Ms este doar de 0,18; Sp - citirea pe litere - recunoaşterea lipsei literelor/sunetelor din cuvinte. Cattell şi Haktian consideră că acest factor nu apare ca factor în studiile anterioare, deoarece s-a folosit doar un singur test pentru acest factor, fiind imposibilă obţinerea unui factor. Deoarece există o bună corelaţie cu V şi W atunci când se scrie/pronunţă un cuvânt literă cu literă/sunet cu sunet, se consideră că acest factor fie este primar, fie dependent de aceşti doi factori; E - judecata estetică - abilitatea de a detecta principiile artistice de bază. La fel ca şi Mk acest factor este dependent de experienţa anterioară; Mm - memoria semnificaţiilor - implică învăţarea legăturilor dintre perechile între care există legături cu sens. Corelaţia dintre Mm şi Ma este de 0,35 ceea ce demonstrează că acestea sunt comportamental diferite; O1 - originalitatea flexibilităţii ideatice - rezultă din testele lui Guildford şi Hoepfner (1971) care urmăresc producerea divergentă a celulelor claselor semantice din modelul lui Guildford. Există o corelaţie ridicată între acest factor şi Fl şi O2; Fl - fluenţa ideatică - abilitatea de a reproduce rapid idei pe o temă dată. Se distinge de Wl, fluenţa cuvintelor şi fluenţa asociativă şi expresivă care nu sunt cuprinse în acest studiu, dar care sunt analizate de (Guildford şi Hoepfner); W - fluenţa cuvintelor - rapida producere a unor cuvinte după o literă cerută dar fără a cere şi un anumit înţeles. Acest factor a fost descoperit anterior de Cattell în 1933; 73

CORNEL HAVÂRNEANU

O2 – originalitate - la fel ca şi O1 este un factor relativ nou descoperit pe baza testelor lui Guildford, în care subiecţii trebuiau să combine 2 obiecte într-unul nou, funcţional. Testului viza evaluarea producţiei convergente a transformărilor semantice, în prezent acesta având pondere în factorul producţie divergentă (Guildford şi Hoepfner, 1971); A - ochirea - implică coordonarea rapidă ochi-mână; Rd - abilitatea de reprezentare prin desen - în desenarea obiectelor stimul este cotată precizia liniilor şi curbelor; D - raţionament deductiv - implică deducţia, raţionamentul plecând de la general la particular; Mc - coordonare motorie generală; Amu - înclinaţie muzicală şi sensibilitate totală - factor descoperit în testul lui Seashore (aptitudine muzicală); Fe - fluenţa expresiei - descoperit de Guildford (1967), exprimarea verbală pentru evaluarea ideilor. ams - viteză motorie - descoperit de Guildford; asd - viteza de discriminare a simbolurilor - descoperit de Guildford; J - judecată - abilitatea de a rezolva probleme atunci când judecata şi estimarea au un rol important. Acest factor a fost descoperit de Guildford; Factorii de ordinul doi rezultă din corelaţiile dintre factorii primari. Cattell şi Horn (1966) au descris cinci factori secundari care se bazează pe factorii primari. gf - inteligenţa fluidă - include inferenţe, inducţie, memoria span, flexibilitatea de închidere, precum şi viteza intelectuală. gc - inteligenţa cristalizată - este un factor al testelor tradiţionale. Se bazează pe factorii abilităţilor verbale, mecanice, numerice şi sociale. gv - vizualizare - are la bază deprinderile în care vizualizarea este importantă cum ar fi: orientarea spaţială şi desprinderea marginilor formei. Cattell consideră că în cercetările anterioare vizualizarea apare ca factor primar. gr - capacitatea de restabilire sau fluenţa generală - include fluenţa ideatică, fluenţa asociativă, testele de asociaţii irelevante. gs - factorul vitezei cognitive - afectează viteza pentru o mare varietate de sarcini. Include viteza în performanţa mecanică, scriere sau calcul numeric. Inteligenţa fluidă şi cea cristalizată sunt cei mai largi factori de ordinul doi influenţând mult varianţa testului de abilitate. Aptitudinea fluidă şi cristalizată Natura acestor două abilităţi a fost studiată de Cattell (1967 şi 1971). În concepţia sa inteligenţa fluidă, care este o abilitate raţională de bază ereditară şi reflectă eficienţa fluxului de informaţii prin creier care este transpusă în deprinderi valorizate cultural (deferit de la o cultură la alta). Astfel se produce inteligenţa cristalizată. Din punctul de vedere al construcţiei testului trebuie făcută o distincţie. Aptitudinea cristalizată poate fi testată prin intermediul itemilor care solicită cunoştinţe şi deprinderi relevante pe care trebuie să le aibă indivizii unei culturi. Aptitudinea fluidă poate fi măsurată fie prin sarcini care nu solicită cunoştinţe sau solicită cunoştinţe care sunt supraînvăţate astfel încât au devenit automate, fie prin intermediul unor sarcini care sunt atât de inedite încât subiecţii trebuie să le lucreze din nou. 74

PSIHODIAGNOSTIC (I)

Majoritatea testelor de inteligenţă măsoară amestecat atât inteligenţa cristalizată cât şi cea fluidă. Factorii g, gf, gc ai lui Spearman Analiza factorială a abilităţilor a dus la o varietate de factori de structură care au la bază numeroasele corelaţii dintre variabilele din sfera abilităţilor. Se observă că factorul g pe care multe teste de inteligenţă încearcă să-l măsoare a fost împărţit în aptitudinea cristalizată şi fluidă. Acestea sunt înalt corelate la vârstele tinere, însă indivizii învaţă sau nu (în funcţie de familie şi cultură) deprinderi culturale la nivele diferite. Nu numai Cattell s-a ocupat de aceste două noţiuni ale factorului g. Carroll (1983) şi colegii au obţinut independent o structură şi factori primari asemănătoare cu cei ai lui Cattell. Analiza factorială a postulat structura abilităţilor atât de diferită încât nici un test de inteligenţă nu ar putea fi construit (Guildford, 1967). Analiza factorială pe bazează pe rotaţiile Procustes, în care nu trebuie să aveam încredere, apărând probleme de calcul prin aceea că sunt utilizate rotaţiile ortogonale care automat exclud factorii de ordinul 2 şi astfel factorul g. Unii autori au încercat să egaleze aptitudinea fluidă cu factorul g a lui Spearman (Undeheim, 1981, Crombach, 1984). Gustaffson (1988) consideră că dificultăţile tehnice asociate identificării pot fi rezolvate prin analiza probabilităţii maxime. Astfel, aptitudinea fluidă este de fapt factorul g a lui Spearman, iar aptitudinea cristalizată este echivalentă cu factorul cunoştinţe educative care a fost extras de Vernon şi cunoscut ca factorul v.ed. Atât gc cât şi v.ed, reprezintă expresii ale aptitudinii fluide în cultură. Este mai bine să privim factorul g ca un amestec de cei doi factori, aptitudine fluidă şi cristalizată, bază a abilităţii raţionale, abilitate de a percepe relaţii şi a deduce corelaţii şi care pot fi aplicate la orice tip de sarcină.

VII.2. ITEMII TESTELOR DE INTELIGENŢĂ După ce am definit inteligenţa ca abilitate de bază prin care se deduc corelaţii şi se percep relaţiile, trebuie să fim preocupaţi de itemi ca pot fi folosiţi pentru a măsura această abilitate. Fluiditatea intelectuală poate fi măsurată prin intermediul unor sarcini nefamiliare sau cu materiale foarte bine cunoscute de diferiţi indivizi în procesul de învăţare astfel încât să nu afecteze rezultatele. Inteligenţa cristalizată poate fi testată cu ajutorul unor materiale care reflectă deprinderile achiziţionate şi valorizate cultural. În acest caz vor apărea diferenţe în parte datorate educaţiei sau clasei sociale. Nu vom descrie fiecare tip de item care poate să apară în testele de inteligenţă. Vom discuta doar despre acei itemi care sunt cei mai frecvent folosiţi şi care au o pondere mare în factorii respectivi. În testele de inteligenţă este important ca itemii să varieze uşor în dificultate. În scopuri comparative este util ca acelaşi tip de itemi să fie folosiţi pentru grupe de vârstă diferite. Itemii trebuie să fie flexibili. Este util ca forma itemului să fie aplicabilă la o mare varietate de situaţii. Există tipuri de itemi care sunt utilizaţi atât pentru măsurarea inteligenţei fluide cât şi a celei cristalizate. Vom descrie în continuare diferiţi itemi utilizaţi în testele de inteligenţă.

75

CORNEL HAVÂRNEANU

Analogii Analogia este un tip de item care se găseşte în cele mai multe teste de inteligenţă. Nivelul de dificultate este uşor de modificat dacă ţinem seama de relaţia dintre elemente. Datorită înaltului grad de flexibilitate, pot fi construite analogii pentru o mare varietate de situaţii. Sternberg a analizat factorial aceşti itemi în încercarea de a clarifica procesele cognitive implicate în rezolvarea de probleme care solicită inteligenţa. Exemple de analogii Exemplele au fost alese pentru a evidenţia modalităţile de măsurare a factorului g. Analogiile sunt folosite pentru testarea factorului g deoarece soluţiile lor implică deducerea relaţiei relevante între prima parte a analogiei şi aplicarea acesteia la restul analogiei: Item 1: Cotobatura este pentru pasăre ceea ce este vipera pentru ... a. animal, b. furnică, c. peşte, d. pasăre, e. reptilă Acesta este un item uşor şi este o măsură a gc (inteligenţei cristalizate) deoarece cunoştinţele biologice elementare necesare pentru rezolvarea acestui item reprezintă o expectanţă culturală. Itemul este uşor pentru că relaţia cu membrii unei clase este simplă şi pentru că soluţia, de a pune “viperă” într-o clasă analogă, nu ar trebui să necesite efort la vârsta de 9 ani. Dacă itemul este folosit în studii interculturale ar putea să apară eşec dacă speciile respective nu sunt prezente în arealul geografic cu care sunt familiarizaţi subiecţii. Distractori cu alegeri multiple Este important ca distractorii să distragă evident. Pentru un item este important să observăm în ce proporţie subiecţii dintr-un eşantion completează fiecare distractor. Astfel, dacă trei distractori sunt evident greşiţi, pentru rezolvarea corectă, nimeni nu-i va alege, iar itemul devine uşor de ghicit. Se întâmplă ca în urma analizei de itemi, un item să fie eliminat deoarece corelaţia acestuia cu scorul total al testului să fie considerabil redusă. Uneori este dificil să se conceapă buni distractori. O modalitate de a obţine distractori buni este aceea de a prezenta itemii unui grup de subiecţi care dau răspunsuri libere. Cele mai frecvente răspunsuri greşite date de subiecţi sunt considerate ca fiind buni distractori. Poziţia răspunsului corect trebuie să fie întotdeauna întâmplătoare pentru ca astfel răspunsurile corecte să nu fie date în funcţie de poziţia lor. Item 2: Papagalul este pentru pasăre ceea ce este koala pentru ... a. animal, b. furnică, c. mamifer, d. pasăre, e. reptilă Acest item reprezintă un echivalent intercultural pentru itemul 1, evident folosit în Australia. Analiza de item, prin compararea valorilor lui p, a corelaţiilor între item şi scorul total precum şi ponderea în factor a itemului, permite să vedem dacă aceşti item sunt echivalenţi. De asemenea pot fi comparate curbele de distribuţie ale itemilor. Item 3: Samson Agonistes este pentru Comus ceea ce este The Bacchae pentru … a. Oedipus Rex, b. Medaea, c. The Cyclos, d. Prometheus Bound, e. The Tempest Am utilizat acest item pentru a ilustra anumite aspecte ale unui item. Este clar faptul că acest item necesită cunoştinţe literare. Este un item dificil dacă nu ştim cine a scris aceste texte şi natura cuvintelor. Dificultatea vine mai curând de la conţinutul implicat şi nu de la relaţii. Este posibil ca acesta să fie un item sărac pentru că relaţia nu este dificil de dedus. Comus este opusul tragediei. The

76

PSIHODIAGNOSTIC (I)

Bacchae este o tragedie lui Eurupide şi trebuie să ne uităm după o lucrare non-tragică. Aceasta este “Ciclopii” (The Cyclos). Acest item ilustrează faptul că un item de analogie dificil poate să nu fie o bună măsură nici a abilităţii cristalizate şi nici a celui fluide, atunci când conţinutul acestora este obscur. În testul de analogii a lui Miller (Miller, 1970) rezolvarea itemilor presupune un nivel ridicat de informaţii. Itemii măsoară inteligenţa cristalizată, nivelul ridicat de dificultate al acestora datorându-se dificultăţii relaţiilor dintre conţinuturile analogiei. Itemul 4 este un exemplu pentru un astfel de item: Item 4: Televizorul este pentru microscop la fel ca telefonul pentru ... a. amplificator, b. microprocesor, c. microundă, d. microfon, e. difuzor. Acest item cu siguranţă necesită anumite cunoştinţe şi el trebuie să măsoare inteligenţa cristalizată. Totuşi chiar dacă subiectul cunoaşte dispozitivele electronice mici, relaţia care trebuie dedusă nu este la fel de simplă ca în exemplul anterior. Este o relaţie a distanţei mărimii amplificării în câmpul vizual. Răspunsul corect este a. Distractorii acestui item au fost cu atenţie aleşi. Subiecţii care nu vor realiza relaţia precisă vor alege microfon. Toţi distractorii care au fost aleşi se referă la sunete sau micro pentru a nu permite ghicirea lor. Exemplele pe care le-am prezentat reprezintă baze ale analogiilor, dar marele lor avantaj este acela că pot fi construite foarte multe tipuri de relaţii pe baza lor. Poate fi manipulată mărimea în analogii: Item 5: Şoimul este pentru vultur la fel ca duba pentru ... răspunsul corect este camion. Este un item simplu care măsoare inteligenţa cristalizată şi este folosit pentru copii din şcoala primară. Exemplul următor ne arată cât de abstracte pot fi analogiile. Item 6: mare este pentru enormitate la fel ca obosit, pentru ... răspunsul corect este apatie. Acest item măsoară gc pentru că depinde de bogăţia vocabularului. Relaţia dintre substantiv şi adjectiv nu este dificil de dedus. După cum s-a demonstrat (Vernon, 1961) vocabularul este cel mai bun predictor al abilităţii cristalizate şi raţionamentul verbal are pondere mare în acest factor de ordinul 2. Toate aceste şase exemple de itemi măsoară inteligenţa cristalizată deoarece raţionamentele sunt expresia culturii noastre. Acest tip de itemi pot fi folosiţi şi pentru a testa inteligenţa fluidă. Cattell (1971) argumenta că inteligenţa fluidă poate fi testată folosind itemi care sunt supraînvăţaţi de subiecţii unei culturi sau itemi care sunt la fel de nefamiliari subiecţilor din punct de vedere educativ sau social. Relaţiile dintre literele din alfabet şi relaţiile numerice pot fi testate în analogii. De asemenea pot fi folosiţi itemii vizuali, non-verbali, configuraţii spaţiale. Exemplele de itemi vizuali, numerici sau alfabetici sunt simple şi pot fi banali pentru a fi adecvaţi testelor de inteligenţă. Ei au fost incluşi pentru că ilustrează modul în care analogiile pot fi folosite pentru a măsura inteligenţa fluidă. Pentru aceşti itemi calitatea lor ar trebui determinată prin intermediul analizei de item sau analizei factoriale.

77

CORNEL HAVÂRNEANU

Item 7. este pentru

a.

b.

la fel ca

c.

pentru

d.

e.

Aceasta este un exemplu tipic de item non-verbal gc care măsoară abilitatea spaţială. Se observă că nu este nevoie de nici un fel de cunoştinţe pentru a rezolva acest item simplu. Pot fi construiţi itemi de acest tip care au un nivel ridicat de dificultate. Similar sunt folosiţi itemi non-verbali pentru testarea interculturală a inteligenţei. Item 8: E este pentru H la fel ca G pentru ....... a. P, b. J, c. K, d. O, e. F Este un item simplu bazat pe succesiunea alfabetică. Tipul de raţionament cerut pentru rezolvarea itemului este similar celui implicat în rezolvarea itemilor verbali. Item 9: D este pentru W la fel ca L pentru ............. a. O, b. N, c. T, d. R, e. H Între D şi W este o relaţie de simetrie, au poziţie simetrică la începutul alfabetului şi la sfârşitul acestuia. O simetrie asemănătoare trebuie găsită pentru L. Item 10 25 este pentru 10 la fel ca 53 pentru .......... a. 2, b. 8, c. 35, d. 15, e. 24 Relaţia nu este evidentă dar nu necesită multă matematică sau abilităţi de calcul pentru a o descoperi: 10 este produsul dintre 2 şi 5. Exemplele de analogii prezentate arată cum aceste forme de itemi pot testa abilitatea de a deduce relaţii de diferite tipuri, de nivele diferite de dificultate şi folosind o varietate de materiale verbale şi non-verbale. Nivelul de dificultate se referă mai curând la complexitatea relaţiei care trebuie dedusă, decât la caracterul confuz al informaţiilor necesare. Un bun test de inteligenţă poate fi construit folosind analogii de diferite tipuri. După cum am discutat anterior varianţa unui test poate fi împărţită în varianţă adevărată şi varianţă eroare. Scorurile obţinute la un test nou, construit dintre-un singur tip de itemi, vor fi compuse din varianţa specifică itemilor. Nu se recomandă în practica psihometrică să se folosească teste alcătuite dintr-un singur tip de itemi. Astfel Matricile Progresive Raven sunt administrate împreună cu un test de vocabular. MPR măsoară inteligenţa fluidă în timp ce testele de vocabular măsoară aptitudinea cristalizată. Aplicarea MPR împreună cu testele verbale au ca scop reducerea varianţei specifice a itemilor. Alţi itemi folosiţi în testele de inteligenţă 1. Similitudini Aceşti itemi constau dintr-un set de substantive, verbe, obiecte, numere, forme/figuri care toate, în afară de unu fac parte din aceeaşi categorie. Subiectul trebuie să aleagă elementul care nu se potriveşte cu celelalte. Subiectul trebuie să deducă relaţia dintre itemi pentru a stabili asemănările şi diferenţele dintre membrii clasei. La fel ca şi în cazul analogiilor, această formă de itemi poate fi uşor manipulată din punctul de vedere al nivelului de dificultate, atât al relaţiilor implicate cât şi al informaţiei solicitate. Pentru testarea gf va fi nevoie de itemi care necesită un nivel scăzut de informaţii. Pentru

78

PSIHODIAGNOSTIC (I)

testarea gc sunt necesare informaţii despre nivelul educaţional şi clasă socială, deoarece acestea pot afecta nivelul de inteligenţă fără ca raţionamentul cerut să fie dificil. Exemple 1. Vrabie, graur, liliac, pescăruş, rândunică. Acesta este un item simplu care măsoară abilitatea cristalizată şi are la bază abilitatea de a face distincţia între păsări şi non-păsări (mamifere - păsări). 2. Concret, abstract, îmblănit, iubitor, iute. Este un item foarte simplu pentru gc, în care alegerea răspunsului corect se bazează pe existenţa unui adverb printre adjective. Se observă că răspunsul corect poate să nu fie concret, la fel ca în cazul substantivelor Acest lucru distinge itemii testului de inteligenţă de cei ai testelor de cunoştinţe, care de asemenea solicită deducerea relaţiilor 3. 24, 63, 10, 48, 35. Acesta este un exemplu de item numeric, despre care nu ştim sigur dacă măsoară inteligenţa cristalizată şi care depinde de evidenţele empirice. Relaţia dintre patru numere constă în faptul că dacă adunăm 1, ele sunt pătrate. Numai numărul 10 din şir nu are această proprietate. Fiind necesare cunoştinţe de matematică pentru a rezolva acest item problema devine una de abilitate cristalizată, pentru a descoperi relaţia aceasta. 4.

Acesta este un exemplu de item non-verbal. Este un item uşor. Doar unul dintre itemi nu are linii drepte, şi nu sunt necesare cunoştinţe pentru rezolvarea lui. De aceea poate fi folosit pentru măsurarea inteligenţei fluide la copii. Observăm că şi pentru aceşti itemi nu este o problemă creşterea nivelului de dificultate. Atât inteligenţa fluidă cât şi cea cristalizată poate fi testată folosind o mare varietate de astfel de itemi. 2. Secvenţe Această formă de itemi poate fi folosită atât pentru itemii verbali, non-verbali sau numerici, pentru testarea ambelor aspecte ale factorului g. Totuşi se potriveşte mai bine itemilor non-verbali şi numerici. În cazul itemilor numerici soluţionarea lor nu implică prea multe cunoştinţe matematice sau de raţionament. Secvenţele non-verbale sunt singurele forme de item care alcătuiesc Matricele Progresive Raven. Acesta este unul dintre cele mai bune teste care măsoară abilitatea fluidă (Carroll, 1983). Exemple de itemi a) 9, 13, 15, 19, 21.... Acesta este un exemplu de item numeric, pentru a cărui rezolvare nu sunt necesare cunoştinţe de matematică, deoarece itemul creşte cu 4 apoi cu 2. b) 0,4, 2,4, 14,4, 86,4 ..... Acest item demonstrează că un item poate fi dificil. Relaţia este simplu de determinat dar necesită cunoaşterea operaţiilor cu zecimale. c) Acesta este cel mai simplu item non-verbal posibil. Credem că este clar cum aceste materiale pot fi folosite pentru construcţia itemilor.

79

CORNEL HAVÂRNEANU

d) Această secvenţă este mai dificilă, subiecţii fiind rugaţi să completeze secvenţa selectând răspunsul corect dintre cinci posibile. Trebuie notat faptul că în unele situaţii secvenţele pot să nu fie complete. Se dă începutul şi sfârşitul itemului, iar subiecţii trebuie să completeze mijlocul. e) minuscul, foarte mic, mic, ............. larg, enorm. Subiecţii trebuie să aleagă între minuscul, mare, enorm, greu. Acest item ilustrează secvenţele verbale. Bineînţeles că aceşti itemi se potrivesc doar pentru abilitatea cristalizată, oferind informaţii despre ponderea vocabularului în gc. Aceste trei forme de itemi sunt mult utilizaţi în teste de inteligenţă. După cum am văzut aceşti itemi sunt folosiţi pentru că pot utiliza o varietate de materiale şi pot avea nivele diferite de dificultate. Ei sunt utili pentru măsurarea ambelor abilităţi. Pentru a reduce monotonia testării (plictiseala reduce întotdeauna precizia şi validitatea testului) s-au imaginat şi itemi de bază: 1. Variante ale analogiilor. Heim (1975) a utilizat o variantă interesantă a analogiilor standard. Erau date două cuvinte subiecţilor. Aceştia trebuiau să selecteze dintr-o listă un cuvânt care se află în relaţie similară cu ambele cuvinte date. Aceşti itemi pot avea un nivel de dificultate ridicat şi pentru rezolvarea lor este nevoie de un vocabular bogat. Cu ajutorul lor se testează inteligenţa cristalizată a subiecţilor cu un nivel educaţional ridicat. 2. Variante ale itemului 2 similitudini. Este prezentată o listă de cuvinte cu trăsături comune. Subiecţii trebuiau să aleagă din listă un cuvânt sau cuvintele care nu au aceste trăsături comune. 3. Variante ale secvenţelor. a. subiecţilor le se cerea să găsească itemul din mijlocul unei serii; b. subiecţilor li se cerea să nu completeze următorul termen ci unul din final; c. subiecţii trebuiau să rearanjeze termenii în secvenţe. Rezolvarea acestor itemi depinde de abilitatea de a deduce relaţiile dintre termenii itemului. La bază stă abilitatea de raţionament care este esenţa inteligenţei, inteligenţa care este definită prin analiză factorială. Corelaţiile dintre testele de inteligenţă şi criteriile externe indică faptul că abilitatea de raţionament este utilă într-un larg context de relaţii sociale. Alte tipuri de itemi Există şi alte tipuri de itemi care au fost utilizaţi pentru testarea în special a inteligenţei cristalizate. 1. Vocabular După cum deja am menţionat vocabularul este testul care are ponderea cea mai mare în factorul inteligenţă cristalizată şi sunt incluse în testele de inteligenţă individuală. 2. Informaţii generale Sunt de asemenea utilizate pentru măsurarea inteligenţei cristalizate. O persoană mai inteligentă poate vedea mai multe legături între noile materiale şi ceea ce ştie deja în comparaţie cu o persoană mai puţin inteligentă. 3. Itemi variaţi Jense a realizat un catalog cu itemi care sunt mai buni pentru testele actuale. Mulţi dintre ei sunt foarte asemănători cu itemii de bază care au fost descrişi. Această listă cuprinde: asemănări verbale - când două (cele mai asemănătoare cuvinte) trebuie selectate; opuşi similari - când trebuie realizate perechi de cuvinte antonime; completarea propoziţiilor - trebuie completate spaţiile albe ale unei propoziţii; proverbe – elucidarea conţinutului unor proverbe; probleme de raţionament logic; clasificare verbală - când trebuie alese dintr-o listă cuvintele din categorii asemănătoare; silogisme; sinonime; realizarea din inferenţe plecând de la 80

PSIHODIAGNOSTIC (I)

materialul prezentat; inferenţe sintactice - când înţelesul cuvântului trebuie să fie dedus; „pedigriu” descoperirea relaţiilor dintre indivizi; probleme de raţionament numeric. 4. Toţi aceşti itemi verbali sunt exemple ale abilităţii de raţionament pe care testele de inteligenţă încearcă să o măsoare. Jensen a realizat şi o listă a diferitelor tipuri de itemi non-verbali care pot fi găsite în aceste teste. Itemi non-verbali. includ desene care conţin erori ce trebuie descoperite; clasificarea figurilor în care trebuie descoperite două figuri care pot fi puse împreună dintr-o serie; figuri încastrate, unde trebuie descoperită o formă care este încastrată în alte figuri; completarea gestaltului, unde forme şi figuri familiare trebui completate; figuri reversibile, unde subiecţii trebuie să manipuleze mental forme geometrice; numărarea blocurilor, unde sunt prezentate blocuri de desene care trebuie numărate (ultimele două teste măsoară abilitatea spaţială); compararea blocurilor, în care desenele blocurilor trebuie să fie comparate pentru a judeca asemănarea şi deosebirea; vizualizarea spaţială, în care subiecţii trebuie să imagineze cum o bucată de hârtie va fi împăturiră pentru a obţine un anumită formă. Itemii testelor de performanţă includ realizarea unor structuri din mărgele, asamblarea obiectelor; desenarea oamenilor; găsirea drumurilor prin labirint. În afara ultimelor două teste toate celelalte tipuri de itemi solicită abilităţi de bază, raţionalizare şi descoperirea relaţiilor. VII.3. TESTE DE INTELIGENŢĂ INDIVIDUALE ŞI DE GRUP Testele de inteligenţă se pot divide în două categorii - teste individuale şi de grup. După cum sugerează şi numele testelor primele presupun ca subiecţii să fie testaţi cât unul odată, în timp ce testele de grup presupun ca un mai mare număr de persoane să fie testaţi simultan. Avantajele testelor individuale Există câteva avantaje ale testelor de inteligenţă administrate individual, în comparaţie cu administrarea în grup. În primul rând se elimină o serie surse de eroare cum ar fi: întoarcerea a două pagini odată sau ruperea creionului sau stiloului. Aceste aspecte au o importanţă minoră dar atunci când deciziile sunt luate pe baza scorurilor testului aceste surse de eroare trebuie eliminate. Testele individuale permit cercetătorului să observe cum subiecţii rezolvă itemii. Acest lucru poate da informaţii în legătură cu dificultăţile pe care le poate avea subiectul. De exemplu, un subiect poate să găsească un itemi dificil şi să refuze să continue testul până când nu va reuşi să rezolve corect acel item, chiar dacă nu este capabil de acest lucru. Acest mod de abordare a problemelor poate să ajute la explicarea dificultăţilor care apar în rezolvarea problemelor din şcoală, universitate sau de la locul de muncă. Alţi subiecţi lucrează cu mare viteză, iar când se confruntă cu un item dificil ei dau pur şi simplu primul răspuns care le vine în minte fără să încerce să-l rezolve. Aceste informaţii dau mai multe informaţii despre subiect decât scorul la testul de inteligenţă. Un alt avantaj al acestor teste, în comparaţie cu cele de grup, este acela că putem să ne asigurăm să subiectul a încercat cu adevărat să rezolve itemii, sau dacă acest lucru nu este posibil, cel puţin să ştim dacă a fost angajat în rezolvarea itemilor testului. Scorul mic la un test se poate datora faptului că subiectul nu a fost motivat. Din aceste motive testele de inteligenţă individuală dau cea mai precisă măsură a inteligenţei. Două astfel de teste au fost dezvoltate de Wechsler (1944, 1974) şi Standford-Binet (Termaan şi Merrill, 1960).

81

CORNEL HAVÂRNEANU

Avantajele testelor de grup Cel mai evident avantaj al acestor teste, în special în psihologia aplicată, este că permite testarea unui număr mare de subiecţi odată. Psihologul nu trebuie să aibă acelaşi nivel de pregătire şi abilităţi ca în cazul celui care realizează administrarea individuală a testelor. Din aceste motive practice şi financiare testele de grup sunt superioare testelor individuale. Teste de grup sunt cu adevărat obiective, în timp ce testele individuale sunt subiective pentru că cercetătorul doreşte să realizeze un profil cât mai bun al subiectului . Vernon şi Jensen (1961) argumentează că există o corelaţie ridicată între testele de grup şi cele individuale şi că un test de grup bun poate da o măsură validă a inteligenţei. Cea mai comună metodă de validare a testelor de teste de inteligenţă de grup este aceea a corelaţiei cu testele individuale. CONCLUZII Din mai multe motive testele de inteligenţă de grup sunt satisfăcătoare. Există anumite probleme specifice legate de persoană care fac ca un test individual să fie preferat, dar nu trebuie să uităm corelaţia ridicată dintre cele două tipuri de teste. QI - ul Coeficientul de inteligenţă, QI, este pur şi simplu un scor standardizat sau normalizat cu o medie de 100 şi o abatere standard de 15. O astfel de standardizare ne oferă posibilitatea de a face comparaţii între scoruri şi în acelaşi timp acestea să fie mai pline de semnificaţie. Iniţial QI era obţinut prin împărţirea vârstei mentale a copilului, care este rezultatul la test, la vârsta cronologică, rezultatul fiind înmulţit cu 100. Astfel dacă un copil de 12 ani avea o vârstă mentală de 12 ani, rezulta un QI de 100. Similar la vârsta mentală de 8 ani se obţinea un QI de 66. Ulterior s-a renunţat la această metodă deoarece s-a constatat că în anumite cazuri atunci când diferenţa dintre vârsta mintală şi cea cronologică este de un an sau de doi ani se obţine aceeaşi valoare a coeficientului de inteligenţă. De exemplu: 6ani/5ani × 100 = 120 şi 12 ani/10 ani × 100 = 120. În cele două cazuri coeficienţii de inteligenţă sunt identici, deşi în primul caz diferenţa dintre vârsta mintală şi cea cronologică este de un an iar cel de al doilea caz de doi ani. De asemenea s-a constatat că după 15 ani vârsta mentală nu mai creşte în acelaşi ritm cu vârsta cronologică. Din aceste motive metoda de calcul a QI-ului a fost înlocuită cu scorurile standardizate calculate prin raportarea performanţei individuale a subiectului la performanţa medie a grupului de vârstă. TEME OBLIGATORII TEMA NR. 1 La variabila capacitate generală de argumentare subiecţii testaţi au obţinut rezultatele prezentate mai jos. Realizaţi etalonul în decile, respectiv cvartile şi precizaţi în care decil, respectiv cvartil se găseşte un subiect care a obţinut nota 23,08. Valori Frecv. Procent Procent valid 2,78 1 2,9 3,4 3,92 1 2,9 3,4 5,41 2 5,9 6,9 9,38 1 2,9 3,4 10,00 1 2,9 3,4 82

PSIHODIAGNOSTIC (I)

10,81 10,87 12,12 13,51 14,71 15,56 16,67 17,65 17,95 19,15 20,45 20,59 21,05 21,57 22,86 23,08 23,26 23,53 24,44 25,53 28,57 30,23 , -------

Total

1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 2 5,9 6,9 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 1 2,9 3,4 5 14,7 Missing ---- -------

34 100,0

TEMA NR. 2 Un grup de subiecţi care au fost examinaţi folosindu-se un test care măsoară nivelul de umor, a obţinut următoarele rezultate, M=7,5, SD=3,25 Transformaţi în note Z scorurile brute 2,25, 15,5 şi evaluaţi subiecţii care au obţinut aceste scoruri. TEMA NR. 3 Un grup de subiecţi a obţinut următoarele rezultate: Autocontrol: M1=19,8, SD1=3,8; Nivel motivaţional: M2=5,9, SD2=3,3; Sociabilitate: M3=14,8, SD3=2,5; Rezistenţă la oboseală: M4=13,4, SD4=4,3; Rezultatele obţinute de doi subiecţi la aceste probe sunt: Autocontrol: S1=26, S2=18; Nivel motivaţional: S1=24, S2=25; Sociabilitate: S1=10, S2=3; Rezistenţă la oboseală: S1=7, S2=25; Cerinţe: La care dintre probe a obţinut subiectul 1 cele mai bune rezultate? La care dintre probe a obţinut subiectul 2 cele mai slabe rezultate? Realizaţi ierarhia subiecţilor în funcţie de notele obţinute de subiecţi la cele 4 probe.

83

CORNEL HAVÂRNEANU

TEMA NR. 4 Demonstraţi cu ajutorul unui exemplu care este modalitatea de comparare a valorilor diferitelor categorii sau a rezultatelor între aceleaşi categorii obţinute în două cercetări diferite într-o scală nominală. TEMA NR. 5 În urma aplicării unui test s-a obţinut un coeficient de fidelitate rxx1 = 0,63. Abaterea standard a scorurilor observate este Sx=2,9. Calculaţi între ce limite se poate situa un scor adevărat al subiecţilor care au acelaşi rezultat observat de 7, cu o probabilitate de 68%. TEMA NR. 6 Între variabilele atracţia pentru a anumită profesie şi realizare în plan social s-a obţinut un coeficient de corelaţie de rxy=0,52. Interpretaţi coeficientul de validitate obţinut. TEMA NR. 7 Unui grup de subiecţi li s-au aplicat 3 scale: deducţie, evaluare argumente şi evaluare ipoteze. După realizarea inventarului statistic de bază sumar, s-au obţinut următoarele rezultate: Deducţie: M1=8,6, SD=1,9 Evaluare argumente: M2=8,7, SD2=2,2 Evaluare ipoteze: M3=9,3, SD=2,1 Doi subiecţi au obţinut următoarele rezultate: Deducţie: x1=2, x2=11 Evaluare argumente: x1=12, x2=7 Evaluare ipoteze: x1=9, SD=8 1. Transformaţi în note T, stanine şi note sten rezultatele obţinute de cei doi subiecţi 2. La care dintre scale a obţinut primul subiect cele mai slabe rezultate? 3. La care dintre scale a obţinut primul subiect cele mai bune rezultate? 4. Ierarhizaţi subiecţii în funcţie de rezultatele obţinute la cele trei scale.

84

PSIHODIAGNOSTIC (I)

VIII. TESTELE PENTRU ABILITĂŢI DE GRUP ŞI SPECIFICE După cum s-a constat factorul „g” are două componente care asigură o bună proporţie de varianţă în măsurarea abilităţii. Există şi factori importanţi pe care testele de inteligenţă nu le măsoară. Unii dintre aceştia, cum ar fi „W” - fluenţa verbală (abilitatea de a elabora cuvinte pornind de la o literă dată) par să fie înguşti şi specializaţi, în timp ce alţii, cum ar fi „V” - abilitatea verbală - par să fie mai largi, de interes mai general. Factorii de vizualizare şi reamintire par să aibă o importanţă mai mare în viaţa cotidiană. Testele au fost construite pentru a măsura şi alte abilităţi în afara de inteligenţă. Au fost realizate teste care să măsoare abilităţi utile în educaţie, pentru selecţie şi orientare, în psihologia industrială unde se pune accentul pe selecţia persoanelor pentru meserii potrivite. Chiar dacă testele de abilitate, cum ar fi abilitatea spaţială sau verbală, sunt valabile pentru predicţia succesului educaţional şi profesional, nu înseamnă că factorul general „g” nu este implicat în rezolvarea de probleme. Factorul „g” este important, la fel şi ceilalţi factori. De exemplu, un nivel ridicat al lui „g” este necesar atât pentru un inginer cât şi pentru un bun jurnalist. Totuşi un nivel ridicat al abilităţii spaţiale este necesar pentru un inginer, dar reprezintă un slab avantaj pentru un jurnalist. Pentru acesta din urmă este necesar un nivel ridicat la abilităţii verbale.

VIII.1. TIPURI DE TESTE PENTRU ABILITĂŢII DE GRUP Vom trece în revistă itemii pentru principalele teste de abilitate şi vom discuta despre valoarea şi avantajele utilizării acestor teste. VIII.1.1. Teste de abilitate verbală Esenţa testelor de abilitate verbală este acea de a înţelege cuvintele sau ideile. Ele cuprind sinonime, înţelegerea proverbelor, vocabular şi analogii verbale. Abilitatea verbală este probabil cel mai bun indicator al inteligenţei cristalizate. Itemi Vom descrie itemii în termenii a ceea ce ei încearcă să măsoare. Într-unul dintre cele mai bune teste de raţionament verbal „Scala de Raţionament Verbal din testul de aptitudine diferenţiată” (Bennet, 1962) itemii au o singură formă de tipul analogiilor verbale. Aspectul psihologic vizat este capacitatea de a stabili categorii pe baza unor caracteristici sau însuşiri comune între noţiuni. O colecţie de obiecte sau fenomene reunite în aceeaşi grupare sau categorie, pe baza unor caracteristici determinate formează ceea ce numim o clasă. Noţiunea rezumă informaţia esenţială cu privire la o clasă de obiecte sau fenomene. De regulă conţinuturile semantice din domenii de cunoştinţe bine structurate sunt organizate în reţele semantice. Reţeaua semantică este formată din noduri şi arcuri. Fiecare nod reprezintă un

85

CORNEL HAVÂRNEANU

concept şi fiecare arc o relaţie dintre concepte sau dintre acestea şi proprietăţile esenţiale adiacente. Cunoştinţele care alcătuiesc reţeaua semantică sunt organizate ierarhic, în funcţie de gradul lor de generalitate. Reţeaua semantică conţine două tipuri de relaţii: a) relaţii de subordonare; b) relaţii de coordonare. Se face apel la strategia inductivă, subiectul trebuind să găsească o noţiune supraordonată pe baza desprinderii notelor comune ale unui grup de noţiuni şi să identifice elementele de contrast (exemplele diferenţiatoare). Strategia inductivă se bazează pe activitatea de analiză şi comparaţie. Strategia inductivă prezintă la copii (până la 10-11 ani) o formă particulară. Ei nu reuşesc să extragă informaţia necesară din exemplul diferenţiator. Sarcina de lucru: subiectul trebuie să identifice cuvintele care nu pot fi incluse într-o categorie cu celelalte. De exemplu: aici, azi, ieri, deunăzi mâine mahomedan, catolic, ortodox, budist, protestant După cum am menţionat anterior abilitatea verbală are o pondere ridicată în inteligenţa cristalizată. Testele de abilitate verbală au o validitate ridicată. Ele măsoară abilitatea verbală şi corelează ridicat cu inteligenţa cristalizată. Alte teste de abilitate verbală, folosite în special pentru adulţi, conţin pasaje scrise, cu întrebări cu alegeri multiple pentru a testa înţelegerea. Aceste teste au pondere mare în abilitatea cristalizată şi adesea sunt folosite ca teste de inteligenţă mai curând decât ca test care măsoară abilitatea mentală. Testele de abilitate verbală nu pot fi confundate cu cele de cunoştinţe. Cunoştinţele sunt reprezentate de cunoştinţele de gramatică, vocabular, sintaxă. Aceste teste sunt dependente sau corelează cu teste de abilitate verbală dar nu sunt identice. Un individ cu abilitate verbală ridicată care se mută recent în altă ţară cu limbă diferită de a sa va prezenta un nivel scăzut de cunoştinţe în acea limbă. Atunci când redactăm itemii de raţionament verbal este important să nu includem itemi prea dificili care necesită cunoştinţe considerabile de gramatică. Alţi itemi utilizaţi în scalele de raţionament verbal sunt testele de comprehensiune şi înţelegere, în care se cere subiecţilor să explice înţelesul unor proverbe, în mod obişnuit în forma alegerilor multiple, şi a testelor de vocabular. De exemplu: Ce înţelegi prin cuvintele: apogeu, cronică, polemică, pertinent? Citiţi cu atenţie proverbul „Spune-mi cu cine te însoţeşti ca să-ţi spun cine eşti”. Cu care din proverbele de mai jos se aseamănă cel mai mult din punct de vedere al conţinutului: 1. Promisiunea dată e datorie curată 2. Buturuga mică răstoarnă carul mare 3. Omul din soţii lui se cunoaşte 4. Cine se scoală de dimineaţă, departe ajunge 5. Cine s-a fript în ciorbă, suflă şi în iaurt 6. Din pomul bun şi roadă bună se face 7. Năravul din fire nu are lecuire 8. Fiecare îşi trage spuza pe turta lui Itemii acestor teste pot viza şi stabilirea unor relaţii dintre noţiuni. Aspectul psihologic vizat este capacitatea de a înţelege sensul noţiunilor şi de stabilire a legăturilor dintre acestora, operare cu raţionamente inductive analogice. Din punct de vedere structural - operatoriu gândirea constă din 86

PSIHODIAGNOSTIC (I)

structuri cognitive (=informaţii structurate) şi operaţii sau secvenţe de operaţii (= strategii) ce se poartă asupra acestor structuri. Structura cognitivă tipică pentru gândire este noţiunea, care structurează informaţiile generale, necesare şi esenţiale despre obiect sau stare de lucruri. Operaţiile sau prelucrările (procesările) la care este supusă informaţia psihică sunt extrem de variate şi organizate ierarhic. La nivel mediu de analiză a gândirii operaţia cea mai însemnată este raţionamentul (inferenţa). Raţionamentul inductiv analogic, relevat de acest tip de sarcină, presupune inducerea unei structuri. Adică, se bazează pe descoperirea unei reţele constante de conexiuni între elementele unei mulţimi şi apoi aplicarea acestei structuri la o situaţie nouă. Dacă descompunem raţionamentul reclamat în elemente componente (operaţii minimale), obţinem şapte elemente componente: codarea, inferenţa, punerea în corespondenţă, aplicarea structurii descoperite, compararea, justificarea, răspunsul. Detectarea şi transferul structurii de la o problemă - sursă la o problemă - ţintă este dependentă de schemele cognitive ale subiecţilor. Schemele cognitive sunt blocuri organizate de cunoştinţe ireductibile la componentele sale, corespunzătoare unor mulţimi de elemente din realitate. Cercetările au arătat că dintr-o baterie de teste de inteligenţă, subtestele verbale au valoarea predictivă cea mai bună pentru reuşita şcolară ţinând cont de implicarea limbajului în procesul de instruire. Rezultatele la acest tip de teste sunt puternic influenţate de nivelul cultural. Sarcina de lucru constă în identificarea legăturilor semantice dintre noţiunile unei perechi date şi formarea unei noi perechi pe baza relaţiei stabilită anterior. Subiectul trebuie să aleagă al doilea termen al perechii (primul fiind dat) din patru posibilităţi. De exemplu: Cer – albastru Iarbă - ………………/ verde, cardă, mare, deasă Pasărea – zboară Peştele -…………… / fuge, înoată, sare, rapid Toate aceste teste au pondere ridicată în abilitatea cristalizată. VIII.1.2. Abilitatea numerică Abilitatea numerică este uşurinţa de a manipula rapid şi corect numerele. Nu are o legătură foarte apropiată cu abilitatea matematică, care corelează ridicat cu raţionamentul inductiv, abilitatea spaţială şi cei doi factori de inteligenţă. Bineînţeles numerele nu pot fi manipulate făcând excepţie de regulile matematice, astfel că itemii solicită un nivel minim de cunoştinţe aritmetice. Itemi Într-un test pentru adulţi itemii cu alegeri multiple ar trebui folosiţi nu pentru a creşte dificultatea matematică, ci pentru a testa viteza şi precizia. În testul aptitudinilor diferenţiale, de exemplu, itemii testează următoarele procese: adiţionarea, extragerea, divizarea, rădăcina pătrată, procentaje, fracţii. Aspectul psihologic vizat este aptitudinea de a folosi cu uşurinţă simboluri matematice. Se referă la factorul „N” a lui Thurstone. Testele ce vizează factorul numeric sunt probe de calcul simplu ce trebuie executat într-un timp limitat. Factorul numeric astfel măsurat este o aptitudine specifică, primară care nu dă informaţii despre aptitudinea la matematică. Testul nu face apel la raţionament aritmetic, ci doar la folosirea rapidă de simboluri numerice.

87

CORNEL HAVÂRNEANU

Factorul „N” este aptitudinea de manipularea rapidă a unui sistem simbolic urmând o serie de reguli specifice, cu condiţia ca atât sistemul simbolic cât şi regulile să fie perfect asimilate. În cazul acestui test sistemul simbolic corespunde simbolurilor numerice, iar regulile sunt de operaţie aritmetică simplă. Sarcina de lucru: Subiectul trebuie să rezolve itemul, pe baza celor patru operaţii aritmetice, indicând răspunsul corect din mai multe variante posibile. De exemplu: Cât este: 5/5/4 a. 1/5 c. 4 e. 25/4 b. 1/4 d. 5 Este clar că abilitatea numerică vizează viteza şi precizia manipulării numerelor. Aceşti itemi nu solicită o abilitate ridicată de raţionament, de aceea există o corelaţie modestă cu cunoştinţele matematice. VIII.1.3. Abilitatea spaţială Aceasta este abilitatea de a vizualiza figurile cu două sau trei dimensiuni atunci când orientarea lor se schimbă. Este o abilitate importantă pentru anumite forme de matematică, cum ar fi geometria sau topografia, anumite domenii din chimie unde structurile sunt importante. Itemii În mod obişnuit itemii constau într-o formă urmată de un set de alte forme. Subiecţilor li se cere să precizeze care dintre formele din set este la fel ca exemplarul rotit. Alţi itemi cer subiectului să identifice dintr-un set de forme pe cea care este la fel cu prima văzută în oglindă sau răsturnată. Trebuie să precizăm că itemii spaţiali de acest tip în care formele geometrice sunt reorientate în spaţiu şi trebuie recunoscute sunt ideale pentru prezentarea în formă computerizată, unde reorientarea poate fi uşor controlată. Un alt tip de itemi de abilitate spaţială cuprind o mulţime de blocuri în care înălţimea coloanelor variază. Subiecţii sunt rugaţi să extragă numărul total de cărămizi din ansamblu, inclusiv pe cele care nu se văd. Un alt tip de itemi indică un aranjament de îndoituri ale hârtiei indicând numărul de îndoituri. Dedesubtul acestora se găseşte o serie de construcţii din foi îndoite, subiectul trebuind să indice din care dintre ansambluri a fost realizată construcţia. Aspectele psihologice vizate sunt percepţia şi reprezentarea spaţială (factorii P şi S definiţi de Thurstone în cadrul teoriei multifactoriale a inteligenţei) - care se referă la vizualizarea spaţială a obiectelor cu posibilitatea de a imagina în plan mintal elementele “ascunse”. Factorii prezintă legături puternice cu inteligenţa generală şi sunt cel mai puţin influenţaţi de mediul socio-cultural al copilului. Sarcina de lucru: constă în găsirea numărului de cuburi din fiecare construcţie incluzând atât cuburile care se văd cât şi cele care nu se văd. De exemplu: Din câte cuburi este compusă următoarea figură?

Sau modele desfăşurate în plan care prin pliere pot forma figuri geometrice: 88

PSIHODIAGNOSTIC (I)

De exemplu: Care din cele patru figuri A,B,C,D, poate fi confecţionată din modelul desfăşurat: A B C D

VIII.1.4. Viteza de percepţie şi factorul precizie Acest factor implică recunoaşterea rapidă a detaliilor observate şi abilitatea de a percepe asemănările şi deosebirile în structura percepută. Se pare că este o abilitate importantă pentru anumite profesiuni, cum ar cea de pilot sau operator radar în care factorul perceptiv joacă un rol important (Carroll, 1971, Nunnally, 1978). Itemii Viteaza este importantă în măsurarea acestui factor. Itemii nu sunt dificili dacă se dă timp de lucru nelimitat. Pentru măsurarea vitezei de percepere, de exemplu în Testul de Aptitudini Diferenţială, itemii conţin forme care trebuie comparate cu alte forme, subiecţii trebuind să marcheze pe cei asemănători sau diferiţi, sau conţin combinaţii de numere sau litere care trebuie comparate cu alte combinaţii similare. Numărul mare de itemi trebuie completat într-un timp limită. De exemplu: care din figurile notate A,B,C,D,E este identică cu figura din stânga imaginii?

A

B

C

D

E

VIII.1.5. Viteza perceptivă de închidere Acesta este un alt factor perceptiv care apare în analiza factorială a testelor. Implică abilitatea de a completa o formă atunci când lipsesc părţi ale sale. Acestor factor corelează 0,61 cu fluenţa verbală. Itemii Cuvintele degradate reprezintă un tip particular de itemi. Cuvintele sunt prezentate cu bucăţi de litere lipsă, subiecţii trebuind să le identifice. Esenţial pentru această viteză de închidere este aceea că recunoaşterea actuală poate fi dificilă dacă degradarea cuvintelor este considerabilă. Itemi similar pot cere subiecţilor să identifice numere sau litere degradate (din care lipsesc bucăţi). May a utilizat un astfel de test pentru a studia flexibilitatea gândirii. Itemii erau prezentaţi pe computer, unde degradarea era întrerupând anumite numere sau pixeli relevanţi. De exemplu: identificaţi cuvântul scris mai jos: VIII.1.6. Raţionamentul inductiv Acest factor implică inducţia, raţionamentul pornind de la specific la general. Este o variabilă cu pondere mare în aptitudinea fluidă. Itemi Un test tipic pentru raţionamentul inductiv sunt literele grupate. Sunt prezentate 5 seturi de câte 4 litere. Subiecţii trebuie să găsească regula care leagă cele 4 litere din set şi să selecteze setul care nu se potriveşte. De exemplu: alegeţi unul din cele patru seturi de litere care nu se potriveşte să fie împreună cu celelalte trei: 89

CORNEL HAVÂRNEANU

1. A.B.C.D. 3.M.N.P.S. 2. B.C.D.F. 4. A.E.I.O. Un alt test este reprezentat de clasificarea figurilor. Fiecare item este reprezentat de 2 sau 3 grupuri, fiecare dintre ele fiind alcătuit din 3 figuri geometrice care sunt asemănătoare prin respectarea aceleaşi reguli. Al doilea rând al fiecărui item este reprezentat de 8 figuri. Subiecţii trebuie să descopere regula şi să clasifice aceste 8 figuri în grupuri asemănătoare. VIII.1.7. Fluenţa ideatică Este abilitatea de a produce un număr mare de idei pe o anumită temă dată. Se pune accent mai mult pe viteză şi fluenţă decât pe calitate. Itemi Se dă un număr de obiecte cerându-li-se subiecţilor să precizeze cât mai multe moduri posibile de folosire a acestora. În alt teste est folosită o listă de obiecte care se aseamănă din punctul de vedere al utilizării. De exemplu: găsiţi cât mai multe moduri de utilizare a unei cărămizi VIII.1.8. Fluenţa cuvintelor Acest factor pune are pune accentul pe creativitate sau gândirea divergentă, în concepţia lui Guilford. Acest factor corelează cu fluenţa ideatică, dar este diferit de acesta. Implică abilitatea de a produce cât mai multe cuvinte pornind de la o literă dată, cvinte care să nu fie legate semantic. Itemii Să se scrie cât mai multe cuvinte posibil dându-se litera de la început, sfârşit sau ambele litere de la început şi sfârşit. VIII.1.9. Originalitate flexibilităţii ideatice Este o măsură a originalităţii ideilor aşa cum a fost studiată de Guilford. Itemii Sunt asemănători cu cei care măsoară fluenţa ideatică. Măsura acestui factor este o evaluare a originalităţii ideilor produse ca răspuns la un item. Originalitatea poate fi reprezentată de o judecată subiectivă sau poate fi original în sensul rarităţii, în comparaţie cu normele. Această ultimă formă este mai precisă în comparaţie cu prima. Totuşi deşi ultima formă este mai precisă decât judecăţile subiective, este posibil să fie mai puţin validă deoarece raritatea răspunsului nu înseamnă că este originalitate se referă la sensul cuvântului. Schizofrenicii şi psihoticii pot da răspunsuri stupide care pot fi cotate în factor. De exemplu, la modalităţile de utilizare a penei, un subiect poate scrie microscop, scalp şi ţintă nucleară, acestea pot fi utilizări normativ originale, totuşi total ridicole. VIII.1.10. Originalitate 2 Acest factor este relativ nou, fiind extras de Cattell (1974) din primul factor originalitate. Diferă ca sens de originalitate, aici trebuind să fie utilizată în situaţii de constrângere şi există itemi tipici pentru măsurarea lui.

90

PSIHODIAGNOSTIC (I)

Itemi Subiecţii sunt rugaţi să combine două obiecte pentru a realiza un nou obiect funcţional. Poate fi obţinută şi o măsură a fluenţei ideatice la fel de bine ca şi o măsură a factorului originalitate. Acesta acoperă tipurile de itemi folosiţi pentru a măsura 10 dintre cei mai importanţi factori primari. Unii dintre aceşti itemi au fost discutaţi în lista care cuprindea variate tipuri de itemi ale testelor de inteligenţă. Factorul de compensaţia gr, care este aspectul educaţional cel mai important pentru factorii de ordinul 2, apare din cei doi factori de inteligenţă, fiind că îmbrăţişează originalitatea şi fluenţa care corelează cu creativitatea cel puţin pentru a limita extinderea/evaluarea. VIII.2. AVANTAJELE MĂSURĂRII FACTORILOR PRIMARI Deşi multe dintre testele care măsoară factorii primari au pondere în structura factorilor secundari, se poate pune întrebarea de ce mai avem nevoie de aceste teste care măsoară factorii primari. În aplicarea testelor psihometrice în domeniul educaţiei, clinic şi profesional este nevoie uneori să măsurăm una dintre abilităţile mai specifice ale subiectului. De exemplu, dacă dorim să selectăm subiecţii pentru zboruri de antrenament cu elicopterul, vom selecta subiecţii care au abilitate spaţială şi ne-am concentra asupra acesteia. Acum factorul de vizualizare este important, dar am fi mult mai precişi dacă am testa separat factorii primari care compun acest factor secundar. Am obţine două scoruri identice la al doilea factor dar care sunt compuse din scoruri diferite ale factorilor de ordinul 1. Nu înseamnă că factorii de ordinul 2 nu sunt importanţi. Pentru multe situaţii testele de inteligenţă sunt cea mai utilă măsură. Una dintre problemele testării unui număr mare de factori primari este acea că ele tind să coreleze, varianţa lor fiind explicată de factorul g. Aceasta este problema principală a testelor de aptitudini. Ele nu diferenţiază destul între aspectele primare ale factorului g. VIII.3. TESTE DE ABILITATE SPECIFICĂ ŞI ALTE TESTE Din cauza naturii analizei factoriale nu putem spune că există un număr finit de abilităţi umane. Factorii primari explică mult din varianţă atunci când se foloseşte un număr mare de teste de abilitate. După cum argumentează Cattell multe dintre testele în varianta creion-hârtie (în forma modernă teste computerizate) măsoară diferite abilităţi care sunt utile pentru educaţia academică. Totuşi sunt multe abilităţi care pot fi observate în viaţa cotidiană şi pentru care nu există teste, cum ar fi de exemplu, abilităţile practice ale meşteşugarilor. Dacă aceste abilităţi şi deprinderi ar fi supuse analizei factoriale este posibil ca să deducem noi factori. Apare problema diferenţei dintre un factor general şi un factor specific. Pentru toate testele construite există pericolul obţinerii unui factor specific folosind un număr mare de itemi similari. Aceşti factori nu corelează decât cu itemi similari. Acest lucru a apărut, parţial, în modelul abilităţilor umane a lui Guilford (1967) care postulează existenţa a 120 de abilităţi. În psihometrie există un acord asupra faptului că există un anumit număr de abilităţi speciale, şi testele pot fi divizate pentru a le măsura. Vom discuta în continuare despre aceste teste care vizează abilităţi speciale.

91

CORNEL HAVÂRNEANU

Abilitatea muzicală Shuter (1968) consideră că aceste abilităţi pot fi măsurate folosind mai multe tipuri de teste. Acest lucru este surprinzător ştiind că abilitatea mentală este diferită de inteligenţă precum şi de alte abilităţi, nu sunt suficiente pentru expertiza aptitudinii muzicale. Se poate argumenta că îndemânarea muzicală reprezintă pur şi simplu cunoştinţe pe care oricine le poate dobândi. Aceasta este concluzia unui studiu realizat pe muzicieni. Este adevărat că cu efort o anumită măiestrie în muzică poate fi obţinută de mulţi oameni. Totuşi viteza cu care muzicienii talentaţi învaţă, sugerează că trebuie să existe abilităţi speciale. Există un număr de abilităţi speciale, dar cea mai renumită este cea dezvoltată de Seashore (1919) în cercetările făcute asupra abilităţii mentale. Itemii Cele mai multe teste de abilitate mentală conţin itemi pe care orice muzician le-ar poseda. Sunt măsurate înălţimea schimbării, analizele acordurilor, memorie, ritm, armonie, intensitate. Unele teste folosesc pianul, altele tonurile pure. Seashore a încercat să măsoare abilităţile muzicale de bază, în sensul tonalităţii, ritmului şi auzului muzical. Acestea corelează din punctul de vedere a lui Shuter (1968) ca un factor muzical general. Abilitate artistică Abilitatea artistică are sens în explicarea diferenţelor individuale ale abilităţii de a desena, de a picta şi a măiestriei artistice, deşi nu este nici o îndoială că exerciţiul şi metodele bune pot duce la dezvoltarea abilităţilor artistice. Totuşi factorii care intră în alcătuirea abilităţilor artistice sunt necunoscuţi. La aceasta se adaugă faptul că selecţia în şcolile de artă se face, în mod obişnuit pe baza performanţelor. Cel mai cunoscut test este Testul Evaluării Artei a lui Meier (1963), care cerea subiecţilor să evalueze care dintre desene este mai bun, unul fiind o lucrare de artă iar celălalt o versiune alterată. Nu există dovezi că acesta ar fi un test valid şi este îndoielnică încredere într-un astfel de test. Abilităţile copiilor mici Psihologii care activează în domeniul psihologiei dezvoltării au realizat un număr de măsurători în speranţa de a măsura inteligenţa sau dezvoltarea intelectului de la vârste foarte fragede, din momentul în care copilul este capabil să răspundă. Scala de dezvoltarea a copiilor realizată de Bayley (1969), de exemplu, este potrivită pentru copii de 2-30 de luni. Acest test reprezintă o măsurare tipică a abilităţilor copiilor. Testul de dezvoltare Gesell măsoară dezvoltarea mentală, dezvoltarea motorie, dar şi comportamentul social la copilului, pe o scală de evaluare. Noţiunea de item este dificil de aplicat deoarece copilului i se prezintă un sunet de clopoţel, examinatorul notând reacţia acestuia. Un alt item este întoarcerea pentru a observa un obiect în mişcare. Aceşti itemi se aplică la vârste foarte fragede, măsurând atenţia şi răspunsul. La vârsta de un an itemii se concentrează spre măsurarea abilităţii de comunicare şi a dezvoltării conceptelor. Se consideră că şi imitaţia reprezintă un indicator important al dezvoltării în scala Bayley, copiilor cerându-li-se să manipuleze păpuşi, căni, jucării, şi să mâzgâlească. Aceste comportamente sunt urmărite atât spontan dar şi ca imitaţie.

92

PSIHODIAGNOSTIC (I)

Problema scalei Bayley, la fel ca şi a altor scări de măsurare a dezvoltării, este slaba corelaţie cu inteligenţa măsurată mai târziu. Damarin (1978) afirmă că este greu să stabilim clinic sau în termeni teoretici ce anume determină aceste rezultate. De fapt scorurile nu corelează ridicat cu QI-ul de mai târziu pentru că conţinutul este total diferit. Considerăm că aceste scale de măsurare a dezvoltării copiilor evaluează dezvoltarea dar nu sunt legate de inteligenţă stabilită ulterior. Cattell (1971) sugerează că acest lucru nu trebuie să ne surprindă, pentru că viteza de dezvoltare a diferitor specii, chiar şi a mamiferelor corelează negativ cu poziţia lor pe scara filogenetică. Aceste scări se pot dovedi utile pentru diagnosticarea unor cazuri severe de retard cu o bază organică. Nu sunt recomandate ca indice al inteligenţei pentru cazurile normale, nemedicale. Abilităţi fizice şi psihomotorii Au un rol important în sport dar şi în cadrul anumitor sarcini, cum ar fi scrierea şi dactilografierea. Aceste abilităţii motorii au fost obiect de studiu în mai multe cercetări realizate de Fleishman şi colegii (Fleishman, 1964, 1975, Fleishman şi Quaintace, 1984). Au fost izolaţi 19 factori principali. Aceşti factori au fost rezumaţi de Peterson şi Bownas (1982), considerându-se că ei sunt o bună măsură a naturii acestor abilităţi psihometrice. 1. Forţa statică: gradul forţei musculare exercitat pentru a mişca continuu un obiect greu. Test – dinamometru. 2. Forţa explozivă: abilitatea de a mobiliza energia pentru un efort exploziv, ca în aruncare. 3. Forţa dinamică: braţe şi trunchi puternice pentru a mişca continuu greutatea propriului corp. 4. Rezistenţă: abilitatea de a menţine activitatea fizică pe o perioadă îndelungată de timp. 5. Evaluarea flexibilităţii: abilitatea de a îndoi/flexa grupuri de muşchi. 6. Flexibilitatea dinamică: abilitatea de a repeta mişcările trunchiului sau ale membrelor atunci când sunt cerinţe legate de viteză şi flexibilitate. 7. Echilibrul corpului: abilitatea de a menţine corpul în balans. 8. Timpul de alegere a reacţiei: viteza de reacţie la un stimul atunci când se prezintă mai mulţi stimuli. 9. Timpul de reacţie: viteza de reacţie la un singur stimul. 10. Viteza de mişcare a membrelor: viteza cu care pot fi executate mişcări ale membrelor. 11. Viteza încheietură-deget: viteza de execuţie a mişcărilor di articulaţia mâinii 12. Coordonarea corpului: abilitatea de a coordona trunchiul. 13. Coordonarea membrelor: vizează abilitatea de a coordona membrele 14. Dexteritatea degetelor: abilitatea de a coordona mişcarea degetelor. Nu se referă la abilitatea de a manipula maşini sau de a controla mecanisme diferite. 15. Dexteritatea manuală: similar cu cea anterioară, dar se referă la mâini. 16. Siguranţa/precizia braţ-mână: abilitatea de a face mişcări braţ-mână precise şi sigure. 17. Nivelul controlului: abilitatea de a face ajustări motorii în timp pentru a schimba relativ viteza faţă de o ţintă în mişcare. 18. Precizia controlului: abilitatea de a controla mişcările musculare necesare pentru a lucra la o maşină sau de a controla mecanisme.

93

CORNEL HAVÂRNEANU

La fel ca în cazul listei factorilor cognitivi, care reprezintă cele mai importante variabile din domeniul cognitiv care trebuie măsurate, lista prezentată mai sus prezintă cele mai importante variabile în domeniul psihomotor. Unii dintre factori nu au o componentă psihologică, cum ar şi rezistenţa sau viteza membrelor (există o componentă psihologică determinativă atunci când persoana abandonează sarcina), în timp ce alţi factori, cum ar fi viteza de reacţie şi alegerea reacţiei corelează ridicat cu inteligenţa (variabilitatea reacţiei s-a sugerat că ar fi o posibilă măsură obiectivă a variabilităţii QI-ului) (Jensen, 1980, Kleine, 1990). Testele psihomotorii Multe dintre testele care măsoară aceşti factori sunt pur şi simplu teste fizice. Testul Purdue Pegboard constă într-o placă de lemn cu goluri în care subiecţii trebuie să introducă forme. Testul rotorului constă într-un plan cu un spot pe care subiectul trebuie să menţină un cursor. Se înregistrează dacă contactul este menţinut sau nu. Măsurarea timpilor de reacţie pentru stimuli luminoşi corespunzători unor taste care trebuie apăsate când apare lumina. Poate fi măsurat timpul de reacţie al subiectului atunci când acesta stă cu mâna pe un buton, dar şi timpul de mişcare pentru a căuta butonul necesar pentru a da răspunsul. Variabilitatea timpilor de reacţie corelează 0,40 cu factorul g. O măsurare interesantă a realizat Fleishman pentru a prezice succesul în meserie în selecţia ocupaţională. Corespunzător acestor factori psihomotori autorii au realizat scări de măsurare pentru diferite posturi, astfel ca postul şi persoana să se potrivească. Aceşti factori sunt mai curând fizici decât psihologici, corelează cu performanţa din viaţa reală şi variază în diferitele stadii de educaţie (Fleishman, 1966). Aceste probe sunt utile pentru selecţia profesională în sarcini specifice.

94

PSIHODIAGNOSTIC (I)

IX. TESTE DE ABILITĂŢI ŞI CUNOŞTINŢE II.1. SENSUL APTITUDINII Termenul de aptitudine, în limba engleză, este frecvent folosit pentru a desemna o capacitate naturală, potrivită şi chiar inteligenţa. Este utilizat în mod obişnuit pentru a descrie o persoană care are aptitudine, de exemplu, pentru calculatoare sau pentru matematică. Aptitudinea este de asemenea şi termen psihologic, existând o varietate de teste de aptitudini, unele larg utilizate, cum ar fi Testul Aptitudinilor Diferenţiale - DAT (Bennet, 1962). Este clar că aptitudinea este un cuvânt care are mai multe înţelesuri şi este important să se definească precis ceea ce se înţelege prin aptitudine sau cel puţin să se clarifice ambiguitatea conceptului. Acest lucru este necesar pentru că testele sunt definiţii operaţionale ale variabilelor. În psihologie aptitudinea se referă la un ansamblu de abilităţi care pot avea o anumită valoare într-o cultură dată. Astfel în DAT putem găsi atât teste verbale cât şi neverbale. Aceste două tipuri de teste relevă confuzia din cadrul conceptului care include ambii factori (verbal şi nonverbal) cât şi unele abilităţi şi deprinderi separate. Astfel abilitatea verbală este un factor primar, „V”, dat de sinonime, înţelesul proverbelor şi analogii. Aptitudinea de scriere nu emerge ca un factor. Este o colecţie de abilităţi care poate fi utilă în societatea modernă, birocratică. Ea implică, de exemplu, viteză şi precizia copierii şi scrierii, calcule simple, verificarea conştientă a listelor şi abilitatea de a rezista la sarcini monotone. Nu este doar multifactorială, deoarece multe dintre acestea sunt mai mult caracteristici temperamentale decât aspecte care ţin de sfera abilităţilor. Psihometric, aptitudinile amintite mai sus sunt distincte. Teste de aptitudine Testul de aptitudine verbală se referă la testarea factorului de abilitate verbală. Testul aptitudinii de scriere este un amestec de itemi. Acest ultim tip de aptitudine ar trebui să fie construit empiric selectând itemi care să discrimineze între subiecţii care nu posedă aptitudinea. Examinarea bateriilor de teste de aptitudine confirmă această analiză, multe dintre ele conţin teste de acest tip: unifactoriale şi multifactoriale. Problemele testelor de aptitudini Unul dintre cele mai folosite teste de aptitudini pentru selecţie şi orientare profesională este DAT (Bennet, 1962). Vom discuta despre variabilele care sunt măsurate pentru a înţelege mai bine dificultăţile generale implicate în folosirea testelor de aptitudini. Acestea sunt: testul de raţionament verbal, abilitate numerică, raţionament abstract, viteza şi aptitudinea de scriere, raţionament mecanic, relaţii spaţiale, gramatică şi silabisire (scriere literă cu literă).

95

CORNEL HAVÂRNEANU

IX.1.1. Testele trebuie să fie unifactoriale Teoria clasică a erorii de testare stă la baza metodelor de construcţie a testelor folosite de psihometricieni. Este clar că pentru a realiza o bună testare, testele să fie unifactoriale. Numai în cazul în care avem două scoruri identice putem vorbi de semnificaţie psihologică identică. Testele multifactoriale sunt cel mai bine înlocuite cu teste care măsoară separat fiecare factor. Dacă se face acest lucru este posibil să se dovedească puterea de predicţie prin ponderea diferită a factorilor, această pondere fiind determinată prin realizarea regresiei multiple pentru criteriu. Astfel, pentru aptitudinile de scriere s-a realizat o corelaţie multiplă între testele separate pentru diferiţi factori putând fi calculată astfel performanţa în acest domeniu, mărimea coeficienţilor β fiind folosiţi pentru a vedea ponderea scorurilor testului. Examinarea variabilelor DAT ilustrează problema testelor multifactoriale. Am menţionat deja testul pentru aptitudinea de scriere, dar testele de gramatică şi citire/scriere pe litere vizează clar aspecte ce ţin de cunoştinţe. Un scor de 12,1 la factorul de citire/scriere pe litere nu înseamnă exact acelaşi lucru cu abilitatea de a citi/scrie pe litere (care se bazează pe percepţia cuvintelor incorecte) şi corelează cu abilitatea verbală „V” şi fluenţa verbală „W”. Factorul de citi/scrie pe litere este probabil limitat, iar testul de citire/scriere pe litere din DAT are pondere în acest factor împreună cu „V” şi „W”. Testul de citire/scriere pe litere este un exemplu de variabilă multifactorială şi este fără îndoială util în munca aplicată pentru a şti dacă o persoană poate sau nu citi/scrie pe litere. Testul de a citi/scrie pe litere poate fi util în orientarea şi selecţia profesională şi reprezintă un argument în favoarea ideii că testele unifactoriale trebuie alese de fiecare dată când este posibil. Citirea/scrierea pe litere nu este o aptitudine ci o cunoştinţă. De aceea nu ar fi nici un motiv ca o cunoştinţă, definită ca o informaţie să fie unifactorială. Citirea/scrierea pe litere poate fi dependentă de achiziţionarea a 2 factori: abilitatea verbală şi fluenţa verbală. Aptitudinea de scriere este mai curând este un set de abilităţi necesare pentru un set particular de deprinderi. Deoarece a citi/scrie pe litere este o cunoştinţă, aptitudinea poate fi considerată ca având mai multe componente, factori puri, separaţi de abilităţi şi cunoştinţe. În realitate lucrurile nu stau chiar aşa. Pur şi simplu cunoştinţele sunt utile în multe meserii. Chiar dacă nu este o aptitudine este bine să se includă un test care să fie utilizat pentru orientarea şi selecţia profesională. Acelaşi argument se aplică şi pentru testul de gramatică, deşi aici cunoştinţele sunt mai mult decât o funcţie doar a factorului V. IX.1.2. Factorul g şi testele de aptitudini O altă problemă a testelor de aptitudini se referă la faptul că în ciuda multitudinii variabilelor, ele sunt rar diferenţiale. Acest lucru se datorează intervenţiei factorului g (Quereshi, 1972). Manualul testului DAT relevă o dificultate comună tuturor testelor de aptitudine. Astfel, inginerii au un scor mare la toate grupele de teste nu doar la aptitudinea mecanică. Dacă încercăm să folosim DAT pentru orientare sau selecţie, rezultatele nu ne vor ajuta. Suma scorurilor la DAT este probabil cel mai bun predictor al succesului în meserie, fiind o bună măsură a factorului g. Rezultatele indică faptul că ingineri, dintre toate grupele testate, au cel mai ridicat nivel la factorul g şi că scalele din DAT au pondere mare în factorul g. Esenţial este că aceste scale măsoară factorul g. Totuşi factorul g este măsurat folosindu-se un conţinut specific al unui test particular de aptitudini. Dacă g trebuie măsurat atunci este mai bine să se folosească scale necontaminate de alţi factori. Informaţiile

96

PSIHODIAGNOSTIC (I)

obţinute în urma aplicării bateriei DAT ar putea fi obţinute mult mai eficient folosind un test de inteligenţă. Un posibil contra argument este acela că influenţa factorului g s-ar manifesta printr-un nivel mai ridicat al scorurilor, dar evidenţiind profilul scorurilor la testele de aptitudine. Din nefericire acest lucru nu se întâmplă. În parte acest lucru este cauzat de faptul că nu toate scalele sunt în mod egal saturate de factorul g. Puterea diferenţială a testelor de aptitudine este iluzorie deoarece scalele au pondere diferită în factorul g. Quereschi (1972) prezintă rezultatele obţinute cu ajutorul analizei factoriale relevând 4 factori care acoperă cel mai mult din varianţă. Ar fi fost interesant să vedem puterea predictivă a testelor de aptitudine după ce factorul g ar fi extras. O analiză factorială oblică permite investigarea influenţei factorului g deoarece aceşti factori sunt corelaţi. Există corelaţii între testul DAT şi testul de inteligenţă Otis, 0,81 cu raţionamentul verbal, 0,69 cu abilitatea numerică, 0,65 cu raţionamentul abstract, 0,58 cu relaţii spaţiale, 0,61 cu raţionamentul verbal, 0,31 cu precizia şi viteza de scriere, 0,48 cu citit/scris pe litere, 0,48 cu logica propoziţiilor. Aceste corelaţii argumentează faptul că testul DAT este în principal un test de inteligenţă ineficient. Pentru selecţia şi orientarea profesională avem nevoie de mai multă informaţie decât ne poate oferi factorul g. Acestea pot fi date prin măsurarea altor grupe de factori, cum ar fi abilitatea spaţială şi verbală. Un test de aptitudine constă în teste pentru diferite grupuri de factori şi o colecţie arbitrară de deprinderi. IX.1.3. Aptitudini şi capacităţi Adesea se face confuzie între termenii de aptitudine sau potenţial şi cel de capacitate. Aptitudinea se referă potenţialul individului în achiziţionarea unor deprinderi capacitatea sau abilitatea se referă la posedarea unor deprinderi care au fost achiziţionate prin experienţă sau antrenament deliberat. Când selectăm indivizii pentru un curs de pregătire sau pentru anumite locuri de muncă (cum este selecţia soldaţilor), măsurarea abilităţii este esenţială. Aici trebuie să măsurăm abilităţile principale care sunt implicate în ocupaţie. În general selecţia de personal nu se realizează aşa. În multe cazuri avem de a face cu indivizi care deja au deprinderile şi pregătirea necesară. Pentru aceste situaţii un test de aptitudini oferă informaţii mai semnificative. Dacă dorim un chirurg vom alege pe cineva care are diploma nu una care are capacitate. Dacă indivizii au deprinderile şi pregătirea achiziţionate este mai bine să folosim aptitudinile ca măsură a selecţiei decât abilităţile sau capacităţile. Pentru tinerii care doresc să participe la un curs de pregătire testele de aptitudini sunt utile pentru diferenţiere. După cum am arătat ele tind să măsoare doar aptitudinea generală, care este mai bine măsurată printr-un test de inteligenţă. Dacă un factor sau un grup de factori specifici sunt mai importanţi pentru un post atunci se vor folosi teste pentru aceşti factori. În consecinţă testele de abilităţi nu sunt valabile aşa cum sugerează numele lor. Valoarea testul DAT rezidă în măsurarea inteligenţei generală şi a grupului de factori specifici. Pentru multe posturi aptitudinile sunt cel mai sensibil indice al performanţei. Dintre subiecţii care au acelaşi nivel al deprinderilor se va selecta persoana cu cel mai ridicat scor a lui g, deoarece este mult mai probabil ca aceasta să aplice mai bine cunoştinţele şi să achiziţioneze noi informaţii pentru a progresa. 97

CORNEL HAVÂRNEANU

Testele de abilităţi şi cunoştinţe Toate testele care evaluează cum stăpânesc subiecţii un anumit câmp sunt teste de abilităţi sau de cunoştinţe. Astfel, probele folosite pentru examinarea publică din şcoală, universitate sunt toate teste de abilităţi şi de cunoştinţe. Aceste sunt teste cu calitate ridicată şi unele dintre ele, care se potrivesc criteriilor psihometrice sunt teste bune. Criteriile unui bun test de abilităţi şi cunoştinţe 1. Trebuie să acopere conţinutul cursului sau la domeniului de cunoştinţe. Una dintre problemele acestor teste este că nu acoperă întreaga arie a cursului, candidaţii putând promova cunoscând doar o mică parte din curs. 2. Trebuie să fie solid. Adică trebuie să aibă un număr mare de itemi şi să fie obiectiv cotat. 3. Trebuie să fie valid. Multe teste nu sunt valide, deşi curios multe dintre ele sunt utile pentru scopuri de selecţie. Astfel dacă se cere subiecţilor să realizeze un eseu este evidenţiată abilitatea verbală. Pentru o bună examinare a cunoaşterii limbii engleze se folosesc teste de cunoştinţe, teste pentru măsurarea factorului g şi de abilitate verbală. Toate aceste caracteristici sunt valabile, dar este mai bine să fie măsurate separat. Se poate pune şi problema de a selecta absolvenţi pentru un post. Absolvirea liceului poate reprezenta un efort ridicat de învăţare dar nu şi un nivel ridicat al inteligenţei sau abilităţii verbale. Pe de altă parte poate fi nevoie de un nivel ridicat al inteligenţei dar de puţine cunoştinţe. Testul pe care îl vom alege va depinde de natura postului care trebuie ocupat. Unii educatori pot fi mulţumiţi dacă testează abilitatea verbală şi inteligenţa, considerând că acestea sunt caracteristici suficiente de promovare la un nivel superior de şcolarizare. Alţii îl privesc ca asimilarea integrală a unui curs. De exemplu, examinarea medicală este privită ca un test de cunoştinţe pe care subiecţii trebuie să-l rezolve în proporţie de 100% pentru a promova. Psihometric, cea mai bună soluţie a fost găsită de universităţile americane. Selecţia doctoranzilor se face după inteligenţă, abilităţi verbale şi numerice, pentru a vedea dacă studenţii sunt suficient de capabili. Gradul/diploma/treapta de examinare sunt acordate prin măsurarea pur şi simplu a abilităţilor. Caracteristicile unui bun test de abilităţi şi cunoştinţe 1. Mulţi itemi aleşi pentru a acoperi întregul câmp. Pot fi consultaţi experţi pentru a verifica. Aceasta implică consultaţii cu specialişti asupra diferitor subiecte pentru a specifica ce trebuie ştiut, în diferite stadii, pentru acele specialităţi. Pentru testarea copiilor trebuie să fim capabili să specificăm ce trebuie ca aceştia să cunoască la fiecare vârstă. Specialiştii trebuie să ierarhizeze diferitele aspecte ale unui materii după importanţa lor. 2. Selecţia itemilor să ţină seama de criterii definite obiectiv. Pentru aceasta este necesar că obiectivele să fie cât mai clare pentru a fi folosite la evaluarea itemilor. Schonell şi Schonell (1950) au realizat un test pentru diagnosticarea dificultăţilor subiecţilor la aritmetică sau citire/scriere pe litere. Acest test a fost în aşa fel divizat încât se pot descoperi exact dificultăţile cu care se confruntă subiecţii, de exemplu confuzia între b şi d. Aceste teste sunt foarte utile pentru diagnosticul dificultăţilor de învăţare şi reprezintă forme speciale ale acestor teste. Testele care au conţinutul precis selectat pot duce la obţinerea unor scoruri care să fie folosite drept criterii de referinţă. Dacă un subiect are scorul 85 la un test de matematică, criteriul de referinţă al scorului ar indica faptul că subiectul a rezolvat corect 85% dintre problemele de algebră care implică inversiunea matricei. 98

PSIHODIAGNOSTIC (I)

3. Itemii trebuie să acopere toate nivelele de dificultate pentru a asigura o distribuţie normală şi simetrică. 4. Itemii să fie cotaţi obiectiv. 5. Norme bune. Este valabilă standardizarea. 6. Testele de aptitudini se potrivesc unei scale Rasch. sau altor modele derivate din teoria răspunsului la itemi.

IX.2. FORMELE ITEMILOR ÎN TESTAREA ABILITĂŢILOR ŞI CUNOŞTINŢELOR 1. Itemi cu alegere multiplă Sunt cei mai folosiţi itemi în cadrul acestor teste, deoarece se potrivesc unei mari varietăţi de teme. Fiecare item are două părţi: a) tulpina care conţine întrebarea sau problema şi b) opţiunile care constituie un set de răspunsuri posibile, dintre care subiectul trebuie să aleagă unul. Multe teste au patru sau cinci variante de răspuns. Vom prezenta câteva dintre cele mai acceptate reguli pentru scrierea unor itemi cu alegeri multiple, reguli care ilustrează avantajele acestora în comparaţie cu testele tradiţionale de aptitudini. a. Itemii trebuie să fie cât mai simpli posibil. Este nevoie de acest lucru pentru a reduce contaminarea scorurilor testului la factorul V, abilitate verbală şi gc, inteligenţa cristalizată. b. Toţi distractorii (variantele incorecte) trebuie să fie la fel de plauzibili. Dacă distractorii sunt evident incorecţi itemul este fără valoare, deoarece acesta va fi rezolvat corect de toţi subiecţii. Distractorii cei mai buni sunt aleşi selectând răspunsurile greşite la itemi într-o sarcină în care subiecţii primesc răspunsurile la itemi în forma deschis-închis. c. Trebuie să fie o singură variantă de răspuns corectă. Uneori dacă privim problema dintr-o perspectivă diferită poate să ne apară corect un alt răspuns. Dacă se întâmplă acest lucru trebuie să renunţăm la acel item sau să schimbăm distractorii. d. Să ne asigurăm că distractorii nu reprezintă răspunsul corect pentru alţi itemi sau evidenţiază răspunsul corect la alţi itemi. e. Să evităm scrierea itemilor doar pentru că sunt uşor de scris. f. Să se evite folosirea distractorului “nici una/unul dintre” cu excepţia itemilor în care sunt evident corecţi. g. Să se evite folosirea distractorului “toate dintre” care slăbeşte itemul. Acestea sunt cele mai importante reguli care trebuie respectate atunci când scriem itemi cu răspunsuri multiple, unele dintre ele având aplicabilitate şi pentru alte tipuri de itemi. Avantajele folosirii acestor tipuri de itemi a. Itemii pot fi uşor cotaţi. Acesta este un aspect important pentru testele care acoperă o mare cantitate de material. Ele permit ca testele să fie lungi, ceea ce îmbunătăţeşte precizia şi validitatea testelor. Uşurinţa cotării reduce erorile de scriere. Răspunsul cu alegere multiplă poate fi cotat folosindu-se chei de marcare ideale pentru cotarea computerizată. Seturile de itemi cu alegeri multiple sunt uşor de prezentat pe computer. b. Ghicirea. Aceasta poate fi o problemă, dar testele cu alegere multiplă reduc posibilitatea de a ghici răspunsul corect din cinci variante prezentate, în condiţiile în care distractorii sunt la fel de atractivi. 99

CORNEL HAVÂRNEANU

c. Conţinutul testului. Folosind un set de itemi cu răspunsuri multiple este posibilă o precisă abordare a conţinutului testului, ceea ce permite psihologului să evalueze cât de potrivite este testul pentru scopul propus. 2. Itemi adevărat - fals Aceşti itemi constau în afirmaţii pe care subiectul trebuie să le marcheze ca fiind adevărate sau false. Folosirea acestor itemi ridică o serie de probleme: a. Ghicirea. Reprezintă o dificultatea reală deoarece există 50% şanse ca să se ghicească răspunsul corect. Testul reprezintă un balans între răspunsul adevărat sau fals. Un subiect care alege fie numai răspunsul fals, fie numai cel adevărat la toţi itemii va obţine 50% din scorul total. b. Este dificil să scrii itemi care sunt irevocabil aderarăţi sau falşi. c. Banalitatea. Nevoia de precizie ne determină să punem accentul pe itemii banali. Ultimele două obiecţii sunt cele mai relevante pentru testele din ştiinţele sociale şi artă. În ştiinţe adevărul absolut (în sensul dat de item) este posibil. În general, itemii adevărat-fals constau în afirmaţii care pot fi înlocuite cu itemi cu alegeri multiple şi care reduc efectul de ghicire. Totuşi există o clasă de itemi de acest tip care sunt utili. În cadrul acestora sunt prezentate subiectului informaţiile, testul măsurând abilitatea acestuia de a înţelege. De exemplu, Kline (1986) prezintă două distribuţii ale inteligenţei, una pentru subiecţii de sex feminin iar cealaltă pentru cei de sex masculin. S-au folosit itemi de tipul adevărat-fals. a. Există mai mulţi bărbaţi decât femei cu un QI foarte mic, mai mic de 45; b. Există mai mulţi bărbaţi decât femei cu un QI foarte ridicat, mai mare de 140; c. Distribuţia inteligenţei subiecţilor de sex feminin este aproximativ bimodală; d. Distribuţia inteligenţei subiecţilor de sex masculin este aproximativ normală; e. Media QI-ului la bărbaţi şi femei este aproximativ aceeaşi; f. Există mai multe femei decât bărbaţi cu un QI între 120 şi 140; g. Există mai multe bărbaţi decât femei cu un QI între 50 şi 60; Această metodă de testare a înţelegerii materialului este utilă şi contrazice pe cei care susţin că obiectivul itemilor testului este de a măsura dacă materialul este învăţat mecanic. Un subiect care nu poate înţelege sau interpreta un item poate doar să-l ghicească. Aceşti itemi pot fi folosiţi pentru o testare detaliată a cunoştinţelor. Astfel, pot fi calculaţi următorii coeficienţi (coeficienţi teta): corelaţia tetraconică, corelaţie biserială, corelaţia punct biserială, tau, ro, phi, indexul G. Concluzii cu privire la itemii adevărat-fals Aceşti itemi sunt utili pentru testarea înţelegerii unui material prezentat şi pentru examinarea detaliată a cunoştinţelor, pentru care itemi cu alegeri multiple ar fi stângaci. Trebuie reţinut faptul că precizia lor este diminuată de ghicire. Din aceste motive sunt de preferat itemii cu alegeri multiple. 3. Itemi perechi Sarcina subiectului este de a potrivi itemii din două liste. Aceşti itemi se potrivesc materialelor factuale sau celor intuitive. Autorii şi cărţile, clasele şi mamiferele sunt exemple de astfel de itemi perechi. Putem avea 4 nume de autori A, B, C, D şi 8 titluri de cărţi. Subiecţii indică, folosind o literă 100

PSIHODIAGNOSTIC (I)

(cea corespunzătoare autorului) cine a scris o anumită carte. Aceşti itemi permit cea mai uşoară testare în detaliu a cunoştinţelor. Deşi ar pute fi construiţi şi itemi cu alegeri multiple, numărul lor ar fi mai mare, ar fi nevoie de 4 itemi cu alegeri multiple şi 32 de distractori. Itemi adevărat-fals ar pute fi folosiţi ‚în acest scop, dar ar fi mai complicat decât folosirea itemilor perechi. Ar fi necesari 4 itemi, câte unul pentru fiecare autor. Nu poate fi folosit acelaşi exemplu pentru fiecare din cei 4 itemi deoarece răspunsul anterior poate influenţa răspunsurile la itemii următori. Astfel dacă autorul A scris cartea 1, autorul B, C sau D nu mai pot scrie cartea 1. Trebuie să precizăm că pentru itemii adevărat-fals, unde informaţiile sunt prezentate subiectului iar itemii testează înţelegerea, este foarte dificil să folosim itemi pereche în locul lor. Itemii adevărat-fals sunt mai buni atunci când se testează informaţia prezentată în test. Pentru a reduce efectul de ghicire şi să ne asigurăm că subiecţii rezolvă itemii făcând alegeri pentru fiecare item, răspunsurile nu trebuie să devină evidente iar listele trebuie să nu fie egale ca lungime. Concluzii: comparaţie între cele trei tipuri de itemi a. Factori specifici. Trebuie minimalizat varianţa specifică datorată unui singur tip de item. Într-o baterie de teste varianţa specifică a unui anumit tip de item poate avea pondere într-un factor, care ar putea fi un factor de grup veritabil, deşi este vorba de o specificitate exagerată - abilitatea de a răspunde la un tip particular de item. O varietate de itemi ar fi în acest caz mai avantajoasă. b. Plictiseala. Folosirea unor itemi variaţi ar reduce plictiseala trăită de subiect în timpul completării unor teste, după cum argumentează Crombach (1976) şi ar îmbunătăţi precizia procedurii de testare. c. Eficienţa itemilor. În construcţia testelor se doreşte un maxim de eficienţă a itemilor. Am văzut anterior că eficienţa itemului depinde de cât de mult material se doreşte a fi testat. Pentru a obţine cel mai bun tip de item trebuie respectate următoarele reguli: 1. Cele mai multe materiale să fie testate cu ajutorul itemilor cu alegeri multiple, aceştia reprezentând itemii de bază în testele de cunoştinţe. 2. Pentru informaţii factuale detaliate sunt utili itemii adevărat-fals şi perechi. 3. Pentru testarea materialului prezentat într-un test sunt valabili itemii adevărat-fals. 4. Pentru motivele prezentate anterior este mai bine să se folosească un amestec format din mai multe categorii de itemi, deşi mulţi itemi adevărat-fals cresc dificultăţile datorate ghicirii. Scrierea itemilor Criterii pentru alegerea itemilor: 1. Claritate. Alegeţi forma itemului care este cea mai clară pentru subiect. 2. Ghicire. Alegeţi forma care reduce efectele ghicirii la minim. 3. Precizie. Alegeţi forma care este cea mai clară şi mai simplă. 4. Relaţiile dintre itemi. Verificaţi dacă variantele itemilor sau chiar itemii nu dau răspunsul sau sugestii pentru alţi itemi. 5. Echilibru. Acolo unde toate alegerile sunt posibile, alegeţi tipul de item care este cel mai rar.

101

CORNEL HAVÂRNEANU

Alte tipuri de itemi Cele 3 categorii de itemi pe care le-am discutat anterior sunt cele mai comune şi utile în cadrul testelor de cunoştinţe. Există şi alte categorii de itemi utile în condiţiile în care materialul rămâne intransigent la testarea cu ajutorul celor 3 metode. a. Itemi cu răspuns limitat. Aceşti itemi cer subiectului să dea propriul lor răspuns, care este totuşi restrictiv, pentru a ne asigura obiectiv că itemii au rezolvaţi. b. Itemi cu răspuns liber. Subiectul poate completa cu ceea ce crede . Se acceptă doar un singur răspuns pe care subiectul poate să-l dea. Aceşti itemi trebuie analizaţi cu atenţie şi trebuie cotaţi obiectiv. Să presupunem că vrem să testăm cunoştinţele subiecţilor despre liniile oblice. Întrebarea “Ce sunt liniile oblice?” este prea generală necesitând un eseu mai curând decât un răspuns simplu. Trebuie să fim mai specifici. Am putea folosi itemi adevărat-fals sau cu răspunsuri multiple. În forma răspunsului liber am putea folosi întrebarea “Cum diferă liniile oblice de cele ortogonale?” Este prea vagă, deoarece subiecţii pot preciza doar că liniile oblice formează un unghi mai mic de 90 de grade. Astfel putem întreba “Ce informaţii cu putem obţine de la unghiurile dintre liniile oblice?” Avantajul acestor tipuri de itemi este acela că reprezintă cel puţin o testare a memoriei mecanice, nu apar distractori şi este mai interesant pentru subiect să completeze decât să compare între variantele prezentate la itemii cu alegeri multiple. c. Itemi cu alegeri limitate. Sunt mai atractivi şi precişi. Itemul cu răspuns liber dat anterior ca exemplu pentru acest tip ar apărea astfel: “Despre unghiurile dintre liniile oblice putem şti că..........” CONCLUZII Aceste categorii de itemi sunt utile doar în situaţiile în care răspunsul trebuie să fie cât mai precis. Itemii cu răspuns liber sunt dificil de redactat. De aceea itemi cu răspunsuri limitate reprezintă o formă superioară. Cotarea lor este dificilă, aceşti itemii nu pot fi prezentaţi şi cotaţi în formă computerizată. Ghicirea În cazul itemilor cu alegeri multiple şi a celor cu răspunsuri limitate poate apărea ghicirea care introduce varianţa de eroare şi scade validitatea. Am menţionat anterior că subiectul poate rezolva prin ghicire jumătate dintre itemii adevărat-fals. Ghicirea este inevitabilă chiar în cadrul unor examene de admitere, promovare sau selecţie pentru o anumită profesie. 1. Subiecţii sunt instruiţi să ghicească. În instrucţiunile testelor se cere subiecţilor să ghicească. “Nu lăsaţi spaţii goale. Dacă nu ştiţi un răspuns sau nu sunteţi sigur, ghiciţi soluţia corectă. ” 2. Completaţi la întâmplare un test apoi cotaţi-l. Această completare este echivalentă ghicirii. Un sistem computerizat de cotare poate fi programat să realizate acest lucru. Formula de corecţie a ghicirii Unii utilizatori de teste folosesc o formulă de corectare a ghicirii. Cea mai utilizată formulă este: g , unde xcorect = c − n −1 x corect - scoruri corectate pentru ghicire; c - numărul de răspunsuri corecte; 102

PSIHODIAGNOSTIC (I)

g - numărul de răspunsuri greşite; n - numărul de variante ale itemului Există cel puţin 4 probleme ale corectării ghicirii: 1. Se presupune că toate răspunsurile greşite se datorează ghicirii, ceea ce nu este în mod necesar adevărat; Subiecţii pot să nu fie informaţi. Formula de ghicire nu ia în considerare acest lucru. 2. Se presupune că atunci când apare ghicirea există un număr egal de şanse pentru fiecare variantă. Pentru anumiţi itemi pot fi schimbaţi distractorii şi totuşi subiecţii să ghicească răspunsul. Pentru aceşti subiecţi formula de corecţie subestimează performanţa. 3. Itemii pot avea un număr diferit de variante, necesitând corecţii ale ghiciri diferite. 4. Corecţia ghicirii se aplica mediei subiecţilor. Pentru cazurile individuale aceasta poate să fie greşită. Pentru toate aceste motive formula de corecţie a ghicirii este rudimentară. Suntem de acord cu Vernon (1960) care afirmă ă ghicirea poate fi ignorată în testele cu variante multiple cu un număr mare de itemi. Având în vedere problemele itemilor adevărat-fals trebuie folosit doar un număr redus de astfel de itemi. Ghicirea este încurajată în testele de viteză. Nu se recomandă corecţia ghicirii.

103

CORNEL HAVÂRNEANU

X. TESTE OBIECTIVE DE PERSONALITATE Vom discuta despre testele de obiective de personalitate, care încearcă să acopere unele dintre defectele chestionarelor de personalitate, deşi după cum vom vedea aceste teste au alte probleme. Chestionarele de personalitate sunt superficiale şi de obicei transparente fiind uşor de falsificat, sunt prea necizelate pentru a încapsula bogăţia şi fineţea personalităţii. Testele obiective şi proiective de personalitate, împreună, caută să elimine aceste neajunsuri. Cu toate obiecţiile aduse de Eysenck (1957) şi alţi autori în ceea ce priveşte lipsa lor de validitate şi fidelitate, ar fi greşit să se renunţe la ele, deoarece aceste teste pot fi utile atât în aplicaţii practice cât şi în cercetare. Înainte de defini aceste categorii de teste trebuie să facem distincţia, în cadrul testelor de personalitate, între măsurarea nomotetică şi cea idiografică. Testele nomotetice sunt legate de dezvoltarea unor reguli pentru înţelegerea personalităţii. Vizează măsurarea trăsăturilor sau dimensiunilor comune, în funcţie de care oamenii diferă. Chestionarele de personalitate sunt măsurări nomotetice tipice, iar analiza factorială reprezintă cea mai potrivită tehnică statistică pentru analiza testelor nomotetice. Psihometria, ca domeniu al psihologiei, este în principal interesată de studiul diferenţelor individuale, măsurarea făcându-se prin urmare cu ajutorul testelor nomotetice. Testele idiografice, în contrast cu cele nomotetice, vizează măsurarea individuală a persoanei, a tuturor aspectelor de personalitate pe care acesta nu le împarte cu nimeni. Aceste aspecte unice şi individuale de personalitate sunt măsurate cu ajutorul testelelor obiective de personalitate. X.1. TESTELE OBIECTIVE Cattell (1973 şi 1957) consideră că în studiul personalităţii există trei surse de date: L, Q şi T. Datele L, date de viaţă, se referă la observaţiile comportamentului actual, datele Q derivă din chestionare, iar datele T se referă la măsurarea prin teste obiective, definite ca teste a căror scop este ascuns subiecţilor. Cattell priveşte datele L ca un criteriu pe care se bazează toate testele, indiferent de tipul lor. Pentru autor testele obiective reprezintă a treia sursă principală de date cantitative din domeniul personalităţii. Aceste teste sunt mai puţin utilizate decât chestionarele sau testele proiective. Cattell (1957) şi Cattell şi Warburton (1967) definesc testele obiective ca teste a căror scop este ascuns subiecţilor, provocând distorsiuni deliberate, şi a căror cotare este obiectivă. Cronbach (1976) a denumit aceste teste ca teste de performanţă. Conform definiţiei testelor obiective, testele proiective cotate obiectiv pot fi incluse în categoria testelor obiective. Testul Rorschach astfel cotat este inclus în categoria testelor obiective (Cattell şi Warburton, 1967). Totuşi noi preferăm să includem teste proiective cotate obiectiv în categoria testelor proiective, pentru că după cum consideră autorii lor şi categoria testelor proiective reprezintă un instrument pentru măsurarea personalităţii.

104

PSIHODIAGNOSTIC (I)

X.2. AVANTAJELE TESTELOR OBIECTIVE Motivul pentru care discutăm despre testele obiective este acela că dacă se demonstrează că ele sunt valide, ele ar avea un avantaj clar faţă de chestionare şi faţă de unele teste proiective. 1. Faptul că este sunt inaccesibile ghicirii, deoarece scopul lor este neclar face să fie mai potrivite în selecţie şi în psihologia aplicată în comparaţie cu alte teste de personalitate. 2. Este mai puţin probabil că în aceste teste să apară seturi de răspunsuri dezirabile, cum se întâmplă în cazul chestionarelor. 3. Este posibil ca unele teste obiective, în special măsurările fiziologice, să poată fi utilizate în studiile transculturale ale personalităţii, domeniu în care chestionarele au o valoare îndoielnică (Kline, 1977). Din aceste motive dezvoltarea validităţii testelor obiective de personalitate reprezintă un aspect important al psihometriei, cu toate că în prezent există puţine dovezi de progres în acest sens. X.3. TIPURI DE TESTE OBIECTIVE Cattell şi Warburton (1967) în compendiul testelor obiective listează 688 de teste, din care derivă 2300 de variabile şi acestea reprezintă doar o parte din testele obiective care pot fi construite. Este evident din definiţie că teste conţin sarcini care pot fi obiectiv cotate, şi pe care subiecţii nu le pot ghici. Ca exemplu vom da sarcina de curăţare a pantofilor, folosind perii şi cremă de pantofi. Vor fi extrase din test următoarele variabile: 1. Numărul de întrebări puse înainte de a începe curăţarea. 2. Timpul scurs înainte de a începe. 3. Tipul necesar pentru realizarea sarcinii. 4. Numărul de periaje folosit în procesul de curăţare. 5. A înlocuit subiectul pantofii? 6. A potrivit subiectul peria şi crema? 7. A folosit material moale? 8. A înlocuit subiectul şireturile? 9. A curăţat subiectul limba de al pantofi? Este clar că se pot folosi o infinitate de astfel de variabile, singura limită fiind ingeniozitatea cercetătorului. Aceste variabile ne indică o dificultate serioasă a testelor obiective: validitatea lor. Cum putem şti ceea ce măsoară fiecare dintre aceste teste? Aceasta este dificultatea testelor, pentru că dacă noi ne dăm seama ce măsoară, atunci şi subiecţii vor fi capabili să ghicească acest lucru şi în acest caz, prin definiţie aceste teste încetează să mai fie obiective. Problema validităţii testelor obiective Nici un teste obiectiv nu poate fi folosit fără să nu existe dovezi empirice ale validităţii şi fidelităţii testului.

105

CORNEL HAVÂRNEANU

Raţiunea testelor obiective După cum indică şi cele nouă variabile din exemplu dat anterior, trebuie să existe o raţiune în construcţia acestor teste. O abordare posibilă în principiu, dar mare consumatoare de timp în practică ar fi să se inventeze măsuri obiective, care să fie puse într-un test empiric. Acest lucru este imposibil. Marea majoritate a testelor obiective nu au nici o dovadă a validităţii lor. Motivele construirii testelor obiective trebuie menţionate, chiar dacă ele au doar o valoare orientativă. Cattell şi Warburton (1967) au prezentat o taxonomie a testelor obiective şi un set de principii pentru construirea unor astfel de teste obiective: ambele vor fi discutate pentru că ajută la înţelegerea lor. O taxonomie a testelor obiective Există trei surse de variaţie în testele psihologice: 1. Instrucţiunile testului. Acestea influenţează modul cum subiectul se raportează la test. 2. Materialele testului 3. Cotarea răspunsului Observăm că primele două categorii nu sunt independente, deoarece instrucţiunile se referă la materialele testului aceste două surse de variaţie grupează într-o singură categorie situaţia stimulinstrucţiune. Situaţia stimul-instrucţiune. Aceasta variază de-a lungul următorilor parametri: 1. Reacţie vs. lipsa de reacţie. În mod obişnuit este cerută reacţia la stimul, dar nu întotdeauna se întâmplă acest lucru, cum este cazul testului de sensibilitate la durere. 2. Răspunsuri inventive vs. răspunsuri selective. Testul TAT cere răspunsuri inventive, iar itemii chestionarelor de personalitate cer răspunsuri selective. 3. Răspunsuri unice vs. răspunsuri repetitive 4. Secvenţe de răspunsuri ordonate vs. secvenţe de răspunsuri neordonate 5. Răspunsuri omogene vs. pattern-uri de răspuns. Unele teste cer răspunsuri de acelaşi fel, alte răspunsuri variate. 6. Răspunsuri naturale vs. limitate. “Lucrează în ritmul tău propriu” comparativ cu “Lucrează cât mai repede posibil” exemplifică aceşti parametri. 7. Reacţii de încheiere vs. reacţie la reacţie. Subiectul reacţionează fie la materialul testului, fie la propriile reacţii, ca în evaluare. Cattell şi Warburton (1967) adaugă la aceşti şapte parametri alte cinci dimensiuni importante, dintre care primele trei sunt subiective şi au o importanţă particulară pentru testele obiective. 8. Semnificaţie imediată vs. semnificaţie atribuită. În testele timpilor de reacţie nu există o altă semnificaţie în spatele testului însuşi. În alte teste, de exemplu cele care examinează opiniile, există atribuiri externe şi simbolice, acestea fiind implicate în distorsiunile tipice ale testelor, ridicând probleme legate de distorsiunea subiectivă a cuvintelor şi conceptelor. 9. Prezentare unui item vs. prezentare globală. Unele teste constau într-o singură sarcină, iar altele într-un set de itemi. 10. Aspectul psihologic al testului. Unele răspunsuri la teste solicită cogniţia (o judecată corectă), alte o judecare a sentimentelor iar altele judecarea familiarităţii sau recunoaşterea. 11. Variaţia motivelor pentru acceptarea situaţiei test. 106

PSIHODIAGNOSTIC (I)

12. Variaţia libertăţii pentru a finaliza situaţia test. Această taxonomie indică o uriaşă varietate de teste obiective posibile - există 213 (8192) tipuri de situaţii stimul-instrucţiuni. Taxonomia nu este completă dacă ignorăm cea de a treia sursă de variaţie - cotarea răspunsurilor. Deşi parametrii cotarea răspunsului nu sunt total independenţi de parametrii descrişi anterior, ei trebuie luaţi în seamă pentru a vedea numărul total de teste care poate fi produs de parametrii stimul-instrucţiune şi cotarea răspunsului.

1.

2.

3.

4. 5.

6.

Parametrii de cotare a răspunsului Obiectivitate vs. auto-evaluare. Acesta este parametrul cel mai important care trebuie să fie bine înţeles înainte de a cunoaşte natura testelor obiective, şi care adesea seamănă cu inventarele de personalitate. Vom exemplifica acest parametru. Într-un test li se cere subiecţilor să evalueze dacă o sarcină particulară (de exemplu, o chelneriţă care aduce în 10 minute şase fripturi pe o masă) este forte bună, bună, slabă, sau foarte slabă. Se vor cota numărul de răspunsuri slab sau foarte slab etc., adică numărul de evaluări critice. Această cotare este în întregime obiectivă şi imposibil pentru subiect să o ghicească. Deşi acest mod de cotare poate fi comparat cu cel al inventarelor de personalitate, de fapt el este diferit. Toate teste obiective sunt obiective în termenii acestui prim parametru. În final precizăm că inventarele de personalitate standard pot fi considerate obiective în privinţa acestui parametru. De exemplu, putem lua în seamă toate răspunsurile “da” sau “adevărat” şi toate răspunsurile “fals”. Comportament deschis vs. răspuns fiziologic. Comportamentele deschise implică întreg organismul, în timp ce răspunsurile fiziologice implică părţi ale organismului, cum ar fi dilatarea pupilei, înroşire etc. Cotarea parametrică vs. neparametrică a răspunsurilor. Cotarea parametrică implică dimensiuni ale răspunsului, cum ar fi timp, erori sau repetiţii. Cotarea neparametrică implică numărul şi varietatea claselor de răspuns, ca în multe teste de creativitate. Cantitatea sau numărul total de răspunsuri vs. fracţiuni ale răspunsului care întrunesc un anumit criteriu. Cotarea omogenă a scorurilor vs. cotare legată de patternuri. Prima cotare este posibilă doar când testul este cotat ca întreg, la fel ca în cazul inventarelor de personalitate. Al doilea tip de cotare, poate avea mai multe forme. Un exemplu ar fi diferenţa de timp în completarea primei şi celei de a doua părţi a testului. Scoruri normative vs. ipsative. Scorul normativ a fost descris în prima parte a cursului. Scorul ipsativ a unui subiect la un item este deviaţia scorului subiectului la itemul respectiv de la media scorurilor.

Totuşi nu toate combinaţiile parametrilor sunt viabile, este clar că există un număr foarte mare de tipuri de teste obiective: 213x26 ceea ce ar duce la 50.000 de tipuri de teste. Deşi există principii pentru construcţia testelor obiective, toate aceste 50.000 de categorii nu pot fi folosite. Cattell şi Warburton (1967) au scurtat lista la 64 de categorii desemnate, luând în considerare cele mai importante tipuri de stimuli şi parametri de cotare, permiţând 8 varietăţi pentru fiecare. Această taxonomie nu este suficientă pentru a înţelege testele obiective. Este important să înţelegem forma dar trebuie să avem în vedere şi conţinutul lor.

107

CORNEL HAVÂRNEANU

O prima dificultate vizează categoriile de variabile care pot fi măsurate - abilităţi, temperament, motivaţie. Nu există un motiv pentru care testele obiective nu pot măsura variabile din aceste sfere, şi este necesar să facem distincţia dintre ele. X.4. DISTINCŢIA DINTRE TESTELE OBIECTIVE DE ABILITATE, TEMPERAMENT ŞI DINAMICĂ Este suficient ca prin analiză factorială să descoperim care sunt variabilele pe care le măsoară testele obiective, dar bineînţeles după ce ele au fost construite. Ar fi util un ghid de construcţie a testului, chiar dacă dovezile empirice sunt necesare pentru a asigura validitatea testului. Cattell şi Warburton (1967) prezintă o serie de detalii în legătură cu această problemă: 1. Sunt definite două situaţii: iniţiale şi complexe. 2. Definirea situaţiei iniţiale: o situaţie iniţială provoacă atingerea scopului şi este un simbol al scopului sau al realizării lui. Acest lucru poate fi descoperit prin procesul de analiză, adică prin analiza statistică a paternului unei secvenţe de comportament care apare în timp. O situaţie iniţială poate fi recunoscută din relaţia cu scopul. În studiul jurnalului unui subiect pe o perioadă de o lună, folosind teste obiective (Cattell, Horn şi Sweney, 1970) Kline şi Grindley (1974) au arătat că o astfel de relaţie apare din dinamica variabilelor măsurate cu ajutorul testelor cu evenimentele din viaţa reală. 3. Definirea situaţiilor complexe: Acestea sunt dependente de precizia evaluării situaţiilor iniţiale. 4. Dacă se schimbă situaţia iniţială, se modifică şi scorul testului obiectiv. Dacă se schimbă complexitatea se modifică şi scorul la un test cognitiv. Toate celelalte teste sunt teste de temperament. 5. Astfel pare uşor de măsurat dinamica şi abilităţile subiecţilor. Este relativ uşor obţinem o măsurare pură asigurându-ne că una din aceste clase de variabile se menţine constantă. De exemplu, dacă măsurăm abilitatea, care de altfel este uşor de măsurat, diferenţele dintre scoruri nu reflectă diferenţe de abilitate ci diferenţele de dinamică, cum ar fi cât de mult efort depun subiecţii. Asemănător, în procedura de selecţie reală a subiecţilor, în care toţi subiecţii depun efor, testele de abilitate sunt pur şi simplu cognitive. 6. După construirea unui test acesta trebuie să fie supus unei analize factoriale, pentru a demonstra că acesta măsoară ceea ce şi-a propus să măsoare. Având acest ghid de realizare a testelor obiective psihologul trebuie să construiască un raţionament pentru elaborarea testelor obiective. Totuşi, aceste taxonomii şi analize sunt foarte abstracte şi din acest motiv autorii prezintă o serie de indicaţii practice bazate pe propria intuiţie şi experienţa lor considerabilă în construirea testelor obiective. X.5. GHID PRACTIC PENTRU CONSTRUCŢIA TESTELOR OBIECTIVE DE PERSONALITATE ŞI MOTIVAŢIE Cattell şi Warburton (1967) listează cinci aspecte care trebuie evitate, la care de obicei recurg amatorii în construirea de teste obiective: 1. Evitarea itemilor de tip chestionar, care prin definiţie nu pot intra în construcţia unui fi un test obiectiv. După cum am menţionat anterior itemii chestionarelor pot fi utilizaţi ca bază pentru testele obiective pentru a defini anumite comportamente tipice. 2. Evitarea problemelor şi a itemilor tip puzzle. Acestea sunt utilizate pentru măsurarea variabilelor cognitive. 108

PSIHODIAGNOSTIC (I)

3. Să nu avem încredere prea multă în “situaţiile stres”. Acestea surprind cel mai bine frica şi agresiunea, dar există şi alte emoţii pe care acestea nu le surprind. 4. Evitarea testelor cu preferinţe stilistice şi estetice. Este adevărat că acestea pot surprinde anumite aspecte de personalitate. Dar este absurd să gândim că ele pot măsura toate aspectele de personalitate, chiar dacă trebuie să ignorăm faptul evident că răspunsurile la aceste teste sunt influenţate de educaţie şi cultură. 5. Evitarea simplei utilizări a testelor proiective - răspunsurile la acestea sunt complexe din punct de vedere factorial (Wenig, 1952). Pe lângă aceste cinci aspecte care trebuie evitate atunci când se realizează un test obiectiv, există şi alte caracteristici. Vom discuta despre cele mai importante dintre ele. 1. Motivaţia diferită a subiecţilor. Acesta reprezintă o dificultate a tuturor testelor, dar este acută în testele obiective în care subiectul nu are nuci o idee legată de ceea ce testul poate să măsoare şi pare o pierdere de timp. Totuşi există persoane care se consideră performante şi care întotdeauna încearcă să rezolve cât mai bine itemii testului, de aceea factorii motivaţionali neintenţionaţi influenţează rezultatele. Cattell şi Warburton (1967) discută cinci posibilităţi de reducere a acestei distorsiuni: a. Testul este divizat în două părţi, pentru care motivaţia se consideră ca fiind la fel. Scorul este diferenţa dintre cele două părţi sau proporţia celor două, o parte fiind considerată deliberat ca fiind afectată de motivaţie. b. Să motivăm subiecţii astfel încât să putem presupune că nu mai apar diferenţe între motivaţiile indivizilor. După cum menţionează Cattell şi Warburton, acest lucru se poate realiza prin utilizarea unor impulsuri de bază, cum ar fi sexul, frica, furia, mai curând decât folosirea unor impulsuri care au mai puţină semnificaţie, cum ar fi sentimentele modelate cultural, dintre care menţionăm sentimentele faţă de familie sau cele religioase, care au o mai mare variaţie. În practică apar însă probleme etice, unele stimulări fiind dificil de realizat (de exemplu înfometarea este imposibil de realizat), în prezent se utilizează frecvent ca stimuli şocuri electrice sau poze cu figuri nude. c. Cotarea poate fi restricţionată de aspectul stilistic sau formal al performanţei subiectului, deoarece acestea sunt mai puţin influenţate de motivaţie, după cum menţionează Cattell şi Warburton, putând fi recunoscute ca specifice într-o mare varietate de situaţii. Toate aceste trei metode se aplică în testele temperamentale mai curând decât în testele obiective dinamice. Ultimele două puncte se plică testelor dinamice. d. Este posibil ca nivelul motivaţional al subiectului să acopere întreaga baterie de teste care este analizată factorial. Dacă se întâmplă acest lucru toate variabilele care au pondere substanţială într-un factor ar putea fi înlocuite. e. Constructorul de teste trebuie să motiveze subiectul pentru a obţine o implicare completă a acestuia. Practic acest lucru nu este uşor de realizat. 2. Testul ca situaţie. Testul poate fi privit va o situaţie care implică anumite comportamente sociale, care reprezintă un aspect important al personalităţii. Mischel (1968) a contestat testele de personalitate considerându-le invalide deoarece scorurile sunt determinate situaţional.

109

CORNEL HAVÂRNEANU

Cattell şi Warburton (1967) subliniază faptul că testul este o situaţie specifică şi că putem crea un set de testele obiective care să implice interacţiuni sociale. Aceste situaţii în miniatură, sunt dificil de creat şi complicat de aplicat în practică. 3. Influenţa abilităţilor şi a cunoştinţelor asupra testelor obiective. Dacă încercăm să măsurăm personalitatea (sau motivaţia) folosind testele obiective influenţa abilităţii şi a cunoştinţelor asupra scorului la teste distorsionează rezultatele. Să presupunem că măsurăm interesele. Cantitatea de informaţii relevante pentru un domeniu particular este o măsură a interesului subiectului pentru domeniul respectiv (Cattell şi Child, 1975). Astfel, copii care sunt interesaţi de fotbal sau cricket au, în mod obişnuit, foarte multe informaţii la zi în legătură cu viaţa şi cariera jucătorilor. Este clar că această măsurare este distorsionată de variabilele abilitate. Este mai probabil ca un subiect foarte inteligent şi cu un nivel mediu al interesului, să obţină acelaşi scor cu un subiect mai puţin inteligent dar cu un nivel foarte ridicat al interesului. Deci măsurarea pur şi simplu a cantităţii de informaţii nu dă o măsură a interesului. O modalitate de a depăşi această dificultate este folosirea scorurilor ipsative pentru fiecare subiect în parte. Acest lucru implică folosirea ca scor la test devianţa subiectului de la medie. Cattell şi Warburton (1967) sugerează că 5 metode pentru a lămuri efectele abilităţii asupra testelor obiective de personalitate: 1. În crearea testului să se reducă cât mai mult posibil cerinţele care se bazează pe abilităţi sau cunoştinţe. 2. La fel ca şi pentru depăşirea problemei motivaţiei, diferenţele de abilitate pot fi reduse folosind un raport sau diferenţa dintre scorurile unui test împărţit în două părţi. 3. Toate testele ar trebui analizate factorial iar factorii în care abilităţile au pondere să fie înlocuiţi. 4. Utilizarea unui conţinut variat al testelor obiective, angajând întreaga varietate de interese umane. Cu cât un test este mai variat cu atât este mai posibil ca acesta să măsoare întregul spectru al personalităţii umane. Până acum am discutat despre problemelor implicate în construirea testelor obiective de personalitate şi motivaţie, şi despre ghidul formal care ajută la dezvoltarea acestui tip de teste. În completarea acestor parametri şi taxonomii, Cattell şi Warburton admit că anumite idei şi intuiţii vagi sunt importante în construirea testelor. Acestea includ: 1. intuiţie clinică; 2. observarea incidentelor critice din viaţa de zi cu zi şi care se reflectă în diferenţele de personalitate; 3. folclor, proverbe, aforisme; 4. situaţii emoţionale din jocuri sau sport; 5. conversaţii observate; 6. surse literare. Testele obiective pot fi aplicate în grup sau individual. CONCLUZII La fel ca şi în cazul celorlalte teste este esenţial să se demonstreze validitatea şi acest lucru poate fi realizat doar prin analiza factorială a variabilelor din câmpul personalităţii, abilităţii şi motivaţiei. Doar puţine din aceste teste au un nivel ridicat al validităţii. În cazul majorităţii testelor obiective validitatea lor nu este cunoscută. 110

PSIHODIAGNOSTIC (I)

Exemple de teste obiective: 1. Agitaţia măsurată prin „agitometru” Acesta este un scaun cu contacte electrice, în diferite puncte, care se închid prin mişcare. Scorul este reprezentat de numărul de mişcări înregistrate într-o anumită perioadă de timp. Ipoteza care stă la baza construcţiei acestui test este acela că agitaţia este un semn al anxietăţii. Era de aşteptat ca testul să aibă pondere în factorul anxietate. Totuşi testul nu are pondere în factorul anxietate, ilustrând dificultatea de construire a testelor obiective. Trebuie să notăm faptul că dacă subiecţii îşi dau seama că scaunul măsoară mişcarea ei vor fi greu de păcălit. Se pune problema reacţiei pe care o vor avea subiecţii, vor fi rigizi, naturali, sau se vor comporta altfel? 2. Desenarea lentă a unei linii. Se cere subiecţilor să deseneze o linie pe o foaie cât mai lent posibil. Scorurile care vor deriva din test: lungimea liniilor, dacă subiectul va înşela, prin ridicarea creionului astfel încât să nu lase nici o urmă sau prin opriri. Acest ultim scor se aştepta să aibă pondere în factorul psihotism al lui Eysenck, şi pondere negativă în factorul G a lui Cattell. Nici una dintre aceste ponderi nu este susţinută de dovezi. 3. Consimţirea de a face farse. Acest test este un chestionar în care subiectul îşi exprimă disponibilitatea de a face practic glume. Raţiunea testului este că subiecţii timizi s-ar bucura de aceste glume. Acest lucru este susţinut de analiza factorială. Surprinzător s-a constat că acest test are pondere în factorul anxietate - subiecţii stabili fiind cei care se bucură mai mult de astfel de glume. 4. Rata metabolismului bazal. Acesta este un exemplu de test obiectiv fiziologic. Cel mai mic consum de oxigen al subiecţilor este convertit în calorii pe oră pe metri pătraţi din suprafaţă a corpului. S-a considerat că acest test are pondere în factorul extraversiune şi exuberanţă. Totuşi testul are pondere într-un număr de variabile de personalitate şi ilustrează probleme legate de încercarea de a crea măsurători fiziologice ale personalităţii. Aceste teste trebuie să aibă dovezi clare ale validităţii. Aceste patru exemple indică motivele pentru care au fost construite testele obiective. Vom da în continuare exemple de alte câteva teste obiective, care conform lui Hundleby (1973) au câteva dovezi ale validităţii: • Cel mai mare număr de recunoaşteri ale fragilităţii sau greşelilor de execuţie în oglindă • Cea mai mare supunere în răspunsurile de la chestionare • Cel mai mare scor într-o listă de neplăceri • Toate aceste teste au pondere în factorul anxietate. Următoarele teste au pondere în factorul asertivitate. • Preferinţa pentru cărţi cu titluri acceptabile social în comparaţie cu cele care au titluri sub formă de întrebări • Cea mai rapidă viteză de bate/lovi uşor • Cel mai rapid tempo al mânii sau a rotirii piciorului • Cea mai rapidă viteză de citire atunci cât se cere subiectului să citească cu o viteză normală • Cea mai mare viteză de citire a unei poezii şi de copiere a unor figuri • Cea mai mare preferinţă pentru activităţile sofisticate şi rafinate

111

CORNEL HAVÂRNEANU

Considerăm că exemplele date sunt suficiente pentru a indica marea varietate a testelor obiective. Tot ceea ce rămâne de făcut este să investigăm şi să stabilim dacă ele sunt valide şi dacă măsoară aspecte importante ale personalităţii.

112

PSIHODIAGNOSTIC (I)

XI. ALTE TIPURI DE TESTE PSIHOLOGICE Vom discuta despre testele psihologice care nu fac parte din grupurile de teste pe care le-am analizat în cursurile anterioare. Ele sunt diferite ca natură şi au o coerenţă care nu se regăseşte în categoriile prezentate anterior. XI.1. METODELE PERCEPTIV-GENETICE Aceste metode au fost dezvoltate de către Kragh şi Smith (1970). Aceşti autori şi-au adus o contribuţie importantă atât pentru dezvoltarea metodei dar şi a bazei teoretice. Aceste metode, după cum sugerează şi numele, au ca obiect de studiu dezvoltarea percepţiei. La baza acestei metode stă presupunerea că percepţia este un proces constructiv, care reflectă totalitatea experienţelor noastre. De exemplu, dacă percepem o fată care iese din universitate, percepţia noastră conştientă este colorată de experienţa noastră anterioară cu fetele şi universităţile. Procesul de percepţie este, bineînţeles, instantaneu şi scapă controlului conştient. Aceste metode caută să supună aceste procese examinării conştiente şi să releve experienţe critice de viaţă şi conflictele inconştiente care afectează percepţia. O astfel de descriere se potriveşte cu ceea ce este denumit în psihanaliză ca fiind mecanism de apărare (Freud, 1946), de aceea nu trebuie să fim surprinşi că cele mai cunoscute teste de acest tip sunt reprezentate de mecanismele defensive. Metodele perceptiv-genetice fac apel la percepţia inconştientă prin prezentare serială a stimulilor, mai întâi, în limitele pragului perceptiv pragul percepţiei şi apoi gradual descreşte viteza de prezentare la tahitoscop. La fiecare prezentare subiectului i se cere să deseneze sau să descrie ceea ce a văzut. Distorsiunile şi schimbările în descrierea stimulilor în timpul seriilor prezentate reflectă conflictele interne şi experienţele individuale care afectează percepţia. Procesul instantaneu de percepţie este desfăcut în fragmente şi expus inspecţiei prin această prezentare serială subliminală. Există două teste, cel mai frecvent utilizate în cercetările perceptiv-genetice, testul mecanismului defensiv, DMT (Kragh, 1985) şi tehnica meta-contrastului (Kragh şi Smith, 1970). Înainte de a descrie pe scurt testul DMT vrem să discutăm despre raţiunea testelor perceptiv-genetice, şi dacă este posibil, în principiu, ca un astfel de test să fie o măsură validă a proceselor inconştiente. Dacă acest lucru ar fi posibil, aceste teste ar reprezenta cel bun instrument ştiinţific psihologic care a fost dezvoltat, deoarece, ar evidenţia ceva care normal este în întregime inaccesibil, chiar prin definiţie, şi anume ar evidenţia procesele inconştiente. Dacă s-ar demonstra testele perceptiv-genetice permit deschiderea pentru o inspecţie publică a procesului privat de percepţie, o nouă ştiinţa ar fi posibil să apară. Astfel, blocajele psihologiei ştiinţifice (se ştie că procesele noastre mentale sunt private şi inobservabile) ar putea fi rezolvate.

113

CORNEL HAVÂRNEANU

XI.2. DMT În acest test se prezintă cartoane cu doi stimuli care diferă doar în detaliu. Aceştia sunt stimuli adaptaţi ai TAT - ului. Pe fiecare carton se găseşte figura unui erou, un atribut al eroului, iar în fundal, la periferia planşei, se găseşte o figură ameninţătoare, hidoasă. Această figură hidoasă aflată la periferia planşei implică testul în măsurarea mecanismelor defensive, deoarece distorsiunile de percepţie din timpul prezentării seriilor pot fi surprinse prin modul în care subiecţii tratează ameninţarea. Sjoback (1967), în descrierea pe care o face acestor teste, consideră că expunerile de la început, când subiecţii văd puţin, prin răspunsurile lor reflectă procese primare, inconştiente, în timp ce expunerile din ultimele stadii devin stimuli de graniţă. În schemele de cotare din testele perceptiv-genetice momentul din seria de stimuli la care apare răspunsul este considerat ca fiind foarte important. Există câteva aspecte care privesc cotarea şi interpretarea testelor perceptiv-genetice (pentru aceste testul DMT este un exemplu tipic). Mai întâi, Kragh şi Smith (1970) argumentează că transformările de înţeles, în dezvoltarea percepţiei, dezvăluită în seriile prezentate, fac posibilă reprezentarea istoriei personalităţii în timpul prezent. Trecutul este disponibil direct investigaţiei experimentale. Noua formă şi semnificaţiile ei pot fi înţelese doar prin referire la istoria vieţii subiectului. Într-adevăr experienţele sunt actualizate prin utilizarea termenilor folosiţi în aceeaşi ordine în care au apărut în viaţă. Acesta este un paralelism, şi semnifică faptul că anul precis al unui astfel de eveniment traumatic poate fi evidenţiat printr-o serie perceptiv-genetică. Acest lucru pare a fi fantastic şi există numeroase dovezi empirice pentru a respinge tehnica, legăturile cu teoria psihanalitică neajutând în această privinţă. Kline (1987), consideră că se poate renunţa la noţiunea de paralelism fără a abandona ideea că importante experienţe de viaţă ar putea fi evidenţiate prin aceste tehnici. De fapt, s-a demonstrat că paralelismul nu are semnificaţie. În afară de evaluarea faptului că fiecare răspuns la testul DMT apare într-o secvenţă strictă de timp şi de faptul că există o demarcaţie clară a ceea ce constituie un răspuns paralel (care nu este un paralelism), paralelismul, în aceste teste însemnând că în anumite situaţii răspunsul de la începutul seriei perceptivgenetice reflectă evenimente de la începutul vieţii, iar unele situaţii de la sfârşitul seriei reflectă evenimente de la sfârşitul vieţii. Deci se poate renunţa la paralelism, fără însă a pierde puterea de interpretare. Validitatea metodelor perceptiv-genetice Nu vom discuta în detaliu despre dovezile validităţii acestor metode, ci vom evidenţia principiile care stau la baza acestor metode. Vom avea în vedere testul DMT, deoarece s-au făcut mai multe studii legate de acest test în comparaţie cu alte teste perceptiv-genetice (Sjoback, 1988). Pentru mai multă claritate vom descrie pe scurt modul cum este cotat DMT. Cotarea necesită deprinderi de cotare, şi deşi cel mai nou manual (Kragh, 1985) îmbunătăţeşte metoda de cotare, care ar trebui supervizate practic. 114

Scorurile la DMT Represia: eroul sau figura ameninţătoare trăiesc sau nu sunt umane; sau ambele sunt obiecte; Izolarea: eroul sau figura ameninţătoare sunt separate sau izolate, sau una dintre ele nu poate fi văzută; Negarea: ameninţarea este empatic negată; Reactanţa: ameninţarea este transformată în opusul ei; Identificarea cu agresorul: eroul devine agresor;

PSIHODIAGNOSTIC (I)

-

Întoarcerea împotriva sinelui: eroul sau atributele sale sunt periculoase sau inutile; atributele devin o ameninţare pentru erou;

Sjoback (1988), care a lucrat cu acest test, consideră că nu există dovezi definitive ale validităţi acestui test. Acest lucru se datorează în mare parte faptului că cei care utilizează testul consideră că acesta este valid şi fac afirmaţii clinice în legătură cu clienţii lor, afirmaţii pe care le consideră ca fiind adevărate. Cooper şi Kline (1982) încearcă să remedieze acest deficit, realizând un studiu intens al testului DMT. Autorii ajung la concluzia că DMT măsoară aspecte diferite de ceea ce măsoară 16 PF. Într-un alt studiu DMT a fost obiectiv cotat folosind analiza G (Holley, 1973), rezultând că factorul DMT corelează pozitiv cu succesul în selecţia piloţilor şi este legat de mecanismele defensive perceptive (Dixon, 1981), care sunt o măsură a represiei. După cum notează şi Kragh (1989), testul DMT este util în selecţia piloţilor, motivul fiind acela că cu cât se apără mai mult, cu atât aceştia vor răspunde mai încet la ameninţare, este mult mai probabil să fie implicaţi în accidente. Există anumite dovezi că testul DMT ar putea fi valid, dar mai este mult până când acest lucru va fi demonstrat. Cea mai bună modalitate pentru demonstrarea validităţii testului ar fi să se combine psihanaliza cu investigarea pacienţilor a căror inconştient este aparent cunoscut. Dacă ar apărea un acord cu judecăţile clinice, acest lucru ar fi o dovadă a validităţii testului DMT. Acesta pare să fie un bun argument din mai multe puncte de vedere: a. Ar fi clar din punctul de vedere al raţiunii acestor metode perceptiv-genetice că, în principiu, ar putea fi folosit orice stimul care reprezentă o ameninţare. Una din dificultăţile cu care ar pute să se confrunte testul DMT ar fi că figura nu este suficient de ameninţătoare, cel puţin pentru unii subiecţi. Westerlundl (1976) în studiul legat de agresiunea pacienţilor schizofrenici a utilizat stimuli diferiţi (între care şi stimuli orali). S-a constat că au apărut mecanisme defensive la stimulii orali, dar nu şi la imagini controlate. b. Fraza “mecanismele defensive au fost constatate” sugerează un aspect important. Când testul DMT este cotat pentru un mecanism defensiv (să spunem reactanţă) atunci când figura ameninţătoare este descrisă ca zâmbind sau fiind plină de dragoste, aceste lucru este considerat ca fiind un suport obiectiv al teoriei freudiene. Această interpretare a mecanismului defensiv nu este cu nimic diferită de cea a unui analist care construieşte o remarcă complementară celei făcută de subiect cu privire la formarea reactanţei faţă de mamă. Cu alte cuvinte, cotarea la DMT se face identic cu interpretare a actului de către un analist, care etichetează răspunsul ca fiind un mecanism de apărare. c. Aceste măsurări realizate cu ajutorul testelor perceptiv-genetice fac publice date rezultate din relatările făcute de subiecţi, care sunt înregistrate în condiţii precise. Din acest motiv metodele perceptiv-genetice sunt utile, pentru că ne permit accesul la un proces care în mod normal este inaccesibil. Aceste inferenţe sunt făcute analizând descrierea mecanismelor de apărare. Rămâne însă să se demonstreze că aceste răspunsuri indică mecanisme de apărare sau alte conflicte inconştiente. Dacă acest lucru nu se va realiza, nu vom putea spune că testele sunt valide, iar testele nu vor mai putea fi recomandate. CONCLUZII Discuţiile despre testele perceptiv-genetice, exemplificate prin testul DMT, indică faptul că acestea permit accesul la un material care este normal inconştient. Studiile clinice, realizate de Kragh şi Smith (1970) şi Sjoback (1988) susţin această concluzie. În această situaţie ni se 115

CORNEL HAVÂRNEANU

pare util să se investigheze validitatea testelor perceptiv-genetice curente şi să se testeze eficienţa altor stimuli. Congruenţa cu ipotezele clinice, psihanalitice constituie o dovadă a faptului că cel puţin protocoalele testelor conţin un eşantion de material relevant.

XI.3. TESTELE SPECIALE UTILIZATE PENTRU PACIENŢII CARE AU LEZIUNI ALE CREIERULUI Pacienţii cu leziuni ale creierului sau suspectaţi că ar avea leziuni ale creierului după accidente sau lovituri, precum şi pacienţii care suferă de demenţă, sunt frecvent testaţi cognitiv pentru a evalua gradul de deteriorare mentală. Aceste evaluări sunt utile nu doar pentru diagnostic, cum ar fi discriminarea între efectele îmbătrânirii şi ale leziunilor (Goldstein şi Shelley, 1975) dar şi pentru tratamentele de reabilitare şi tratament. Mulţi clinicieni utilizează teste de abilitate cognitivă pentru a face discriminări între grupele psihiatrice care prezintă tulburări de gândire datorare unor leziuni ale creierului, chiar dacă abilităţile lor cognitive nu sunt deteriorate. Schizofrenicii cu siguranţă fac parte din această categorie. Vom discuta despre raţiunea şi natura testelor deficitului cognitiv. a. Utilizarea unui standard al testelor de abilitate O abordare obişnuită pentru măsurarea deficitului cognitiv constă în utilizarea unui standard ale testelor de abilitate. WAIS-ul (Wechsler, 1958) este potrivit pentru acest scop, deoarece scalele permit evaluarea anumitor deficienţe cognitive. După cum menţionează Howard (1989) diferite configuraţii ale sub-scorurilor sunt utilizate de clinicieni pentru a indica anumite deficienţe cognitive de natură organică, precum şi altor probleme psihiatrice. Maloney şi Ward (1976) discută în detaliu utilizarea WAIS-ului. Utilizarea WAIS-ului pentru investigarea deficitelor cognitive este împiedicată de faptul că, deşi acesta apelează la cumularea sub-scalelor, acestea sunt totuşi prea scurte. Deficitele cognitive sunt mai bine evaluate nu printr-o măsurare globală a abilităţilor cognitive, ci prin teste care să fie mult mai specifice, care vizează abilităţi limitate. b. Teste speciale Kay (1989) argumentează că testele de inteligenţă (QI), cum ar fi WAIS-ului, nu au fost construite pentru a discrimina pur şi simplu între grupele de subiecţi anormali, deşi după cum am văzut este sunt folosite în acest scop, şi că ar trebui folosite teste special construite care oferă sensibilitatea şi discriminarea necesară. Kay consideră că aceste teste ar trebui să vizeze măsurarea proceselor şi funcţiilor cognitive. Pentru ca aceste teste să fie valabile este nevoie de o bază teoretică, ca cea evocată de Sternberg (1981) şi Cattell (1971). Goldenberg (1989) a fost preocupat de raţiunea dezvoltării acestor teste pentru folosirea lor în diagnostic şi tratament în psihologia clinică. Ideal ar fi ca realizarea testelor neuro-psihologice să vizeze cât mai mult posibil funcţii cognitive specifice. Totuşi cele mai multe teste neuro-psihologice nu au o utilitate specifică pentru că ele sunt desemnate să descrie statusul cognitiv al pacienţilor fără a face referinţă la creier. Goldenberg argumentează că încercările de a construi teste pure pentru un singur factor ale funcţiei cognitive specifice sunt foarte rare, chiar dacă acestea au avut succes. Trăsăturile, deprinderile sau comportamentele sunt complexe factorial. După cum susţine Goldenberg (1989) există unele consecinţe importante ale faptului că de fapt nici unul din teste nu este precis neuro-anatomic. Din acest motiv diagnosticul neuro-psihologic este 116

PSIHODIAGNOSTIC (I)

însoţit de necesitatea de a administrare a unei baterii de teste. Testele neuro-psihologice cu un singur factor şi deficienţele performanţei la un singur factor nu sunt necesare pentru a evidenţia disfuncţia unei singure localizări neuro-anatomice sau a unei simple dimensiuni cognitive. De aceea este nevoie de o baterie de teste neuro-psihologice. În acest context, măsurarea utilă pentru psihologia clinică a unui deficit cognitiv, implică utilizarea unor teste care să măsoare o mare varietate de funcţii în special acele procesări de informaţii care au fost identificate ca fiind importante în psihologia cognitivă. Aceste măsurări pot să permită inferenţe cu privire la locul şi extinderea leziunilor creierului. Warrington (192, 1975 a realizat studii pentru a elucida deficitele care apar în diferite tulburări patologice El a realizat studii de psihologie experimentală cognitivă asupra leziunilor implicate în memoria sistematică şi recunoaşterea obiectelor. A realizat un instrument util - Testul de Recunoaştere din Memorie (Warrington, 1984). Acest test cere subiecţilor să recunoască cuvinte sau obiecte care au fost anterior prezentate. Se poate obţine un scor la recunoaşterea verbală şi cea vizuală şi se consideră că rezultatele ar indica locul leziunilor din creier, ambele scoruri putând fi folosite ca bază pentru diagnostic şi tratament. Acest test este doar o măsură şi nu reprezintă o parte dintr-o baterie. O baterie tipică pentru evaluarea neuro-psihologică este Bateria Luria Nebraska (Golden, 1980), care evaluează un rang neuro-psihologic. Aplicarea testului durează 3½. Această baterie măsoară motricitatea, ritmul, funcţiile tactile şi vizuale, viteza de receptivitate şi expresivitate, scriere, citire, memorie şi procesele intelectuale. Toate aceste teste s-au dovedit utile pentru construcţia unui tablou cognitiv al deficitelor cognitive ale subiectului şi a posibilei deteriorări neuro-psihologice. CONCLUZII În esenţă aceste teste încearcă să evalueze funcţiile cognitive de bază, şi au ca fundament teoretic teoriile psihologice cognitive. Normele sunt esenţiale pentru că ne permit să vedem care sunt afecţiunile tipice ale creierului. XI.4. TESTE SPECIALE ŞI LISTE (CHECKLIST) Vom discuta despre construcţia şi utilizarea testelor care sunt virtual liste (checklist). De exemplu, lista simptomelor sau caracteristicilor unei sesiuni de terapie. Acestea sunt adesea folosite în evaluare şi în studii de psihoterapie, unde se urmăreşte evaluarea progresului sau rezultatelor terapiei sau a ceea ce simt clienţii în legătură cu tratamentul. În studiile lui Sheffield (Shapiro, 1990) sunt prezentate câteva teste de acest tip. Vom prezenta şi noi câteva dintre aceste teste. a. Teste de conţinut. Deşi aceste teste sunt de natură clinică, teste similare au fost construite pentru a fi utilizate în diferite contexte. În psihologia educaţională este posibil să se construiască liste (checklist) pentru evaluarea performanţelor şcolare şi pentru evaluarea problemelor de comportament ale copiilor în clasă. Stott (1957) a construit un set de teste care sunt utilizate în acest scop - Ghidul Bristol de Ajustare Socială - care evaluează comportamentul copiilor la şcoală şi acasă. În psihologia ocupaţională listele sunt folosite pentru evaluarea comportamentului angajaţilor şi sunt valabile pentru evaluarea caracteristicilor dezirabile şi necesare pentru un anumit post. Chestionarul Analizei Poziţiei (McCormick, 1972) este un exemplu pentru acest tip de teste.

117

CORNEL HAVÂRNEANU

b. Fidelitatea şi analiza factorială a testelor Scala de evaluare SCL-90 (Derogatis, 1973) este un exemplu pentru acest tip de teste. Aceasta constă într-o listă de 90 de simptome pe care subiecţii le evaluau cât de mult le-au resimţit în ultimele două săptămâni. Itemi tipici au fost: simt critica celorlalţi, simt că orice lucru pe care îl fac este un efort, exagerez etc. Este evident că dacă simptomele sunt bine alese şi pot fi utile, pentru diagnostic, în găsirea unor grupări de simptoame, în evaluarea şi monitorizarea psihoterapiei, în care se presupune că dacă lucrurile vor merge bine pe parcursul terapiei simptomele vor scădea în intensitate şi vor fi mai puţine ca număr. În utilizarea acestui tip de teste, care sunt complet empirice şi ateoretice, singurul criteriu pentru eşecul sau succesul terapeutic în reprezintă apariţia simptomelor. Pentru astfel de scale trebuie să se demonstreze precizia şi să se arată că aceste scale conţin unul sau mai mulţi factori. În prezent aceste demonstraţi sunt lipsite de semnificaţie. Se presupune că pacienţii fac raportări corecte, fie că au fie că nu au aceste simptome. Astfel, scala are sau nu consistenţă internă. Consistenţa internă şi fidelitatea reflectă pur şi simplu gradul în care aceste simptome se întâmplă să fie asociate cu altele în viaţa de zi cu zi. Acest lucru este departe de situaţia în care se încerca să se demonstreze că un set de itemi ai unui test de personalitate sunt extraşi dintr-un domeniu comun de itemi, în care trebuia să se demonstreze că aceşti itemi sunt legaţi. Pentru a cota precizia consistenţei interne a listelor (checklists) înseamnă pur şi simplu supunerea la ritualul psihometric. Coeficienţii nu sunt importanţi. Acelaşi lucru se întâmplă şi în cazul analizei factoriale. Informaţia că există x factori nu înseamnă nimic mai mult decât că x grupe de simptoame tind să se grupeze împreună. Acestea pot confirma categoriile de diagnostic, care pot prezenta interes clinic. Totuşi în multe situaţii astfel de factori pur şi simplu reflectă asemănările semantice ale itemilor. Un exemplu de astfel de test este scala relaţiilor client-terapeut, care a fost studiată de Shapiro (1990). Un cluster de itemi se referea la ceea ce simt pacienţii despre terapeut iar altul se referea la descrierea terapeutului. Autorii nu fac referire la alte variabile care s-ar afla în spatele testului. Universul de itemi din care a fost realizat testul a fost un set de itemi care descriau terapeuţii. Aceasta este în contrast cu un set de itemi ai extraversiunii, care dacă testul este valid reflectă un set larg de comportamente, care se află în spatele testului. Faptul că pot să existe mai mulţi factori, nu numai unul, înseamnă doar că un scor nu poate fi utilizat bazându-ne doar pe o simplă adiţionare a itemilor liste (checklist). Chiar dacă există câţiva factori într-o listă a simptomelor, numărul absolut al simptomelor, înainte şi după tratament poate prezenta interes. Din aceste argumente se poate vedea că în listele (checklist) nu revendică faptul că este măsurată o variabilă prin intermediul itemilor, precizia şi construcţia factorială este mai puţin importantă decât în cazul testelor psihometrice, unde variabilele sunt mai mult sau mai puţin o listă de itemi asemănători. c. Liste (checklists) şi simţul comun Aceste liste sunt construite intuitiv plecând de la simţul comun, rezultatul fiind acela că este greu de găsit ceva nou. Simţul comun poate fi refuzat dacă ipoteza nu este confirmată. Acest lucru se întâmplă pentru că, prin natura construcţiei lor aceste test nu pot produce noi variabile. Această situaţie contrastează cu testele de personalitate psihometrice unde, variabilele obţinute în urma analizei factoriale, cum fi extraversiunea, anxietatea, obsesii, permit psihologilor să dezvolte noi modele de personalitate.

118

PSIHODIAGNOSTIC (I)

d. Concluzii: liste (checklist) şi natura factorilor Esenţa problemei este legată de natura factorilor. Am subliniat importanţa testelor analizate factorial. Totuşi aceste teste, măsoară factori pentru care există un tip de validitate externă. Un astfel de exemplu este inteligenţa. Factorul inteligenţă, măsurat prin intermediul testelor de inteligenţă, prezic succesul academic, ocupaţional. Dar există şi indexul ridicat al eredităţii. Din nefericire unele teste măsoară pur şi simplu specificităţi umflate (Cattell, 1978). Astfel de teste au o precizie ridicată şi itemii au o saturaţie mare în factorul măsurat. Totuşi factorii cu specificităţi umflate pot fi distinşi de factorii independenţi, importanţi prin faptul că aceşti factori nu corelează cu alte variabile. În esenţă multe liste (checklist) şi teste similare sunt de acest tip. Itemii formează factori pentru că evident similari. În acest caz informaţia psihologică este obţinută din itemii înşişi. Un exemplu va clarifica acest aspect. În scala relaţiei client-terapeut există un item: “Deprinderile profesionale ale terapeutului meu sunt impresionante”. Se presupune că acest item şi ceilalţi itemi similari permit distincţia celor care se bucură de terapie, care se simt bine ca rezultat al terapiei. Totuşi nu se poate face mai mult decât această inferenţă, şi anume că cei care se simt mai bine şi se bucură de terapia găsesc că terapeutul lor este impresionant. Dacă rezultatele sunt slabe, pacienţii care nu se simt mai bine nu găsesc deprinderile terapeutului lor ca fiind impresionante şi doar acest lucru putem să-l afirmăm. Uneori aceste informaţii pot fi valabile dar nimic nu se adaugă analizând factorial aceste teste. Testele au răspunsurile cuantificate în aşa fel încât să fie posibil să se comparare grupele statistice. Se pare că este puţin mai mult decât cunoaşterea anterioară, care punea pe primul loc construcţia testului. 4. Teste de emoţii bazate pe modele circumplex şi alte modele similare Există un mic grup de teste construite după modelul Guttman, numit şi modelul circumplex. XI.5. DESCRIEREA MODELULUI CIRCUMPLEX Acesta este un model particular în care apare analiza în faţetei (facet). O faţetă (facet) este un sistem de clasificare în care fiecare faţetă (facet) poate avea mai multe de nivele de clasificare. În analiza faţetelor (facet), după cum menţionează Nunnally (1978) există un număr de stadii. Să presupunem că avem o colecţia de teste. Mai întâi trebuie să sugerăm o structură a faţetei, în care există o anumită combinaţie a tuturor categoriilor. Această structură propusă ar trebui să ne conducă la o matrice ipotetică de intercorelaţiilor testelor. Atunci când matricea ipotetică este comparată cu corelaţiile actuale, observate, sunt posibile testele statistice (ale potrivirii). Dacă suma faţetelor este bună, atunci cotarea testului trebuie calculată ca o măsură a faţetelor de bază. După cum argumentează Nunnally (1978) această analiză a faţetelor (facet) face referinţă la o analiză corelaţională masivă deoarece se referă la structura ipotetică a întregii matrici mai curând decât la factorii individuali. Faţetele (facet) pot fi explicate în termenii combinaţiilor lor, a factorilor ce stau la baza matricei. Deşi este posibil să derive noi faţete (facet) din corelaţiile dintre teste, în mod obişnuit în analiza faţetelor (facet) se începe cu ipotezele referitoare la faţete şi combinaţiile dintre acestea în cadrul fiecărui test. În cadrul acestui model structura faţetelor este circulară. Fiecare variabilă poate fi privită ca un cluster deoarece este un amestec al componentelor faţetelor. Începem cu variabila 1 (sunt 8 variabile) fiecare variabilă are mai multe în comun cu variabilele vecine decât cu cele care se află la distanţă (de exemplu variabila 1 cu 2, variabila 7 cu 8). Totuşi ele sunt aranjate într-un cerc, în care variabilele din mijloc 4, 5 şi 6 au mai puţin în comun cu extremele decât între ele, în timp ce variabilele de la extreme ce suprapun în termenii compoziţiei faţetelor (1 şi 8). Într-un model circumplex se pleacă de la diagonala 119

CORNEL HAVÂRNEANU

părţilor matricei, numărul de faţete în comun începe de la zero şi apoi creşte indicând natura circulară a naturii varianţei împărţite. Nunnally (1978) ilustrează excelent modelul circumplex plecând de la faţetele comune, care clarifică Cooperant natura ordonării circulare. Trebuie A: Încrezător Docil menţionat că este B: Stabil Responsabil C: Afectiv posibil să B: Stabil D: Supus C: Afectiv A: Încrezător convertim o D: Supus B: Stabil matrice a faţetelor E: Neîncrezător C: Afectiv H: Ascendent comune într-o matrice ipotetică de corelaţii: numărul 7 6 C: Afectiv 8 Modest D: Supus A: Încrezător de faţete comune E: Neîncrezător 1 5 B: Stabil Managerial poate avea F: Instabil G: Ostil 4 2 H: Ascendent legătură cu 3 procentajul de D: Supus varianţă comună, a A: Încrezător E: Neîncrezător F: Instabil cărui rădăcina F: Instabil G: Ostil G: Ostil E: Neîncrezător pătrată este H: Ascendent F: Instabil Sceptic corelaţia. G: Ostil Competitiv H: Ascendent Reproducem aceasta în figura 1. Agresiv Figura 1 Trebuie să facem câteva precizări legate de acest model. Mai întâi, după cum argumentează Nunnally (1978) acest model reprezintă un sumar elegant al datelor în matricei de corelaţie. Aceasta este raţiunea analizei factoriale, dar din analiza factorială nu rezultă un număr evident de factori, dar ea poate fi folosită pentru găsirea unui principiu de rezumare a datelor. Adepţii analizei corelaţionale masive susţin că modelul circumplex permite acest lucru. McCrae şi Costa (1989) argumentează că modelul permite o bună evaluare a personalităţii şi poate fi privit ca un model complementar la descrierea analitică a factorilor. Totuşi metoda analizei masive este complexă din punct de vedere logic şi statistic, iar dificultatea se datorează lipsei de claritate în ceea ce priveşte diferenţele dintre noţiunile de faţetă şi variabilă. O altă obiecţie a fost menţionată de Nunnally (1978). Analiza faţetelor, spre deosebire de analiza factorială nu este o metodă de descoperire. Mai curând este o metodă de testare a ipotezei. Totuşi modelul circumplex este o ipoteză extrem de complexă şi doar foarte rar este posibil ca ipoteza unei structuri cu o astfel de complexitate să ducă la obţinerea de cunoştinţe curente în domenii psihometrice principale ale personalităţii, motivaţiei şi abilităţii. Din descrierea simplificată a modelului se poate observa că faţetele sunt fie prezente fie absente. Totuşi în aplicaţiile realiste ale testelor psihologice o astfel de măsurare simplă este mai puţin probabilă. Se poate avea în vedere şi greutatea diferită a diferitor faţete, iar acest lucru ar duce la complicarea modelului circumplex. Poate că cel mai important aspect se referă la faptul că analiza faţetelor nu este o metodă de construcţie prin analiză a faţetelor de bază. Acest lucru deosebeşte modelul de analiza factorială. 120

PSIHODIAGNOSTIC (I)

Chiar dacă s-a arătat că este un model sumar al matricelor de corelaţie complexe, descrierea nu pare să aibă o semnificaţie particulară. Este un punct de vedere subiectiv. Există autori care pot găsi o descriere valabilă a modelului circular sau o semnificaţie a acestuia. CONCLUZII Din descrierea şi discuţiile asupra modelului circumplex este clar că este o metodă ingenioasă de sumare a matricei scorurilor la test.

XI.6. CERCETĂRILE LUI PLUTCHIK Plutchik a studiat o perioadă lungă de timpe emoţiile. Abordarea psiho-evoluţionistă (Plutchik, 1980) a emoţiilor le leagă de trăsături şi stări. Trăsăturile sunt privite ca stări afective (emoţii) care persistă şi apar frecvent între-o varietate de situaţii. În cadrul teoriei sunt aduse noţiunile de mecanisme de apărare şi mecanisme inconştiente pentru a putea explica conflictele emoţionale şi de coping, tehnicile conştiente fiind folosite pentru rezolvarea acestor conflicte. Aceasta este baza teoretică a testelor de emoţii ale lui Plutchik care sunt făcute să se potrivească modelului circumplex. Aşa cum s-a afirmat trăsăturile de personalitate, în cadrul acestei teorii derivă din emoţii. Trăsăturile rezultă din persistenţa situaţiilor care produc emoţii amestecate. De exemplu, o persoană care întotdeauna simte teamă în situaţii dar care doreşte să fie plăcută de ceilalţi mult mai probabil va dezvolta trăsătura de docilitate (Plutchik şi Conte, 1989). Dacă caracteristicile înnăscute ale emoţiilor se reflectă în trăsăturile de personalitate, atunci, conform lui Plutchik şi Conte (1989), modelul circumplex este bun pentru măsurarea trăsăturilor şi emoţiilor. În termenii modelului circumplex emoţiile pot fi aduse ca faţete ale diferitor trăsături de personalitate. a. Indexul profilului emoţional Plutchik (1980) a descris măsurarea a opt emoţii de bază. Se presupune că toate trăsăturile de personalitate rezultă din amestecul a două sau mai multe emoţii primare. Timiditatea implică frică, de exemplu, iar melancolia implică tristeţea. Indexul este un test cu alegeri forţate în care 12 termeni trăsături de personalitate sunt aranjaţi în perechi, luându-se în seama toate combinaţiile posibile (excluzând patru perechi identice), subiecţii trebuind să aleagă cuvântul din pereche care îi caracterizează cel mai mult. Pentru fiecare cuvânt este ales scorul pe una sau mai multe dintre cele opt dimensiuni emoţionale de bază. Aceste dimensiuni sunt: bucurie, acceptare, surpriză, frică, dezgust, tristeţe, aşteptare şi furie. Acest test măsoară toate dimensiunile care sunt aranjate circumplex în termenii similarităţii şi bipolarităţii. Subiecţii primesc un scor pentru fiecare dintre cele opt dimensiuni ale testului. Apoi acest scor este convertit în centile pe baza unui eşantion de 500 de subiecţi de sex masculin şi 500 de subiecţi de sex feminin. Aceste centile sunt reprezentate grafic într-un cerc împărţit în opt segmente, unde zero este la centru cercului iar centilul 100 pe circumferinţa cercului. Autorii menţionează că precizia/fidelitatea testului este ridicată (Plutchik şi Conte, 1989). Conform acestor autori valoarea mai însemnată a EPI se bazează direct pe teoria emoţiilor, care a determinat alegerea unei dimensiuni ce va fi măsurată, care va fi bază pentru identificarea componentelor emoţionale ale trăsăturilor şi în final se va dovedi o bază pentru măsurarea conflictului amestecului dintre trăsături şi emoţii.

121

CORNEL HAVÂRNEANU

CONCLUZII Nu s-a urmărit evidenţierea valorii Indexului Profilului Emoţional ci de a ilustra modelul circumplex ca bază pentru construcţia unor teste. Plecând de la descrierea teoriei şi a testului este clar că acest model poate fi utilizat în construcţia testului. Înainte de a analiza valoarea acestui model, vom descrie pe scurt instrumentul dezvoltat de Plutchick, şi anume Indexul Profilului de Personalitate, PPI. b. Indexul Profilului de personalitate. Testul EPI se bazează pe faptul că modelul circumplex care este cea mai bună descriere a trăsăturilor. Trăsăturile utilizate în acest test sunt cele indicate de modelul circumplex al lui Conte (1975) şi Conte şi Plutchick (1981), care investighează structura a 171 de itemi. Versiunea finala a PPI-ului conţine 89 de itemi (termeni trăsături) la care subiecţii răspund pe o scală cu 5 trepte de la “niciodată” la “foarte des”. Dimensiunile modelului circumplex sunt: acceptare, supunere, pasivitate, asertivitate, sociabilitate, respingere, agresiune şi revoltă. Întrebarea la care trebuie să se răspundă cu privire la PPI se referă la natura celor opt trăsături. Dacă ele se potrivesc modelului circumplex şi ce vizează ele? După părerea autorilor faptul că trăsăturile se potrivesc modelului are mai puţină importanţă din punct de vedere psihologic. Ele sunt au mai puţină importanţă decât o structură factorială simplă, care ne informează în legătură cu mărimea factorilor, intercorelaţii şi faptul că aceştia sunt factorii principali ai câmpului. Modelul circumplex ne informează pur şi simplu că factorii pot fi aranjaţi logic pe circumferinţa unui cerc. Astfel se elimină problema referitoare la faptul că unii factori pot să nu se potrivească prea bine paternului. Este dificil de validat aceste dimensiuni. Plutchick şi Conte (1989) afirmă că analizând modul cum termenii au fost grupaţi în jurul modelului circumplex, indicând faptul că aceştia au o structură explicită asemănătoare. De exemplu, o grupare este clar legată de agresiune (e.g. “argumentativ”, “beligerant”) şi un alt grup de cuvinte, cum ar fi sincer, puternic, şi candid (nepărtinitor) reflectă asertivitatea şi nu agresiunea. Acest lucru ne atenţionează că argumentele psihometrice trebuie analizate cu atenţie. Afirmaţia “o grupare este clar legată de agresivitate” nu semnifică nimic mai mult decât faptul că autorii cred că acest lucru este adevărat. Pentru a spune că termenii sunt înrudiţi celui de agresiune nu este o problemă de opţiune ci este nevoie de suport empiric care să ofere dovezi. Simpla aserţiune nu este suficientă. Acest lucru este mai important pentru a doua aserţiune, şi anume că cuvinte similare măsoară mai curând asertivitatea decât agresiunea. Această etichetare a dimensiunii este pur şi simplu un aspect al validării. Este important pentru că un argument al acceptării modelului circumplex este acela că dimensiunile trebuie să posede calităţile asemănării şi polarităţii. Dimensiunile indexului profilului de personalitate sunt identificate doar în termenii itemilor lor, iar această formă de validitate nu este satisfăcătoare. Faptul că ei sunt aranjaţi într-un circumplex ne dă puţină informaţie despre structura lor. Este nevoie de o analiză factorială a acestor scale cu factori principali de personalitate. Este posibil ca să rămână puţină varianţă neexplicată în IPP şi de aceea putem avea nevoie ca descrierea circumplexă să fie înlocuită. Concluzii Aceste două exemple de teste ale lui Plutchik şi colegilor care se bazează pe modelul circumplex care nu pare să aibă un suport suficient pentru a fi utilizat şi a avea valoare în construcţia testelor. Acest tip de descriere ar putea fi utilă dacă s-ar arăta că variabilele din modelul circumplex nu se potrivesc cu alte structuri. Acest lucru nu se aplică şi în cazul IPP, pentru că toate scalele corelează semnificativ cu Scala Stimei de Sine a lui Fitts (1965). Aceasta înseamnă că acest scale nu sunt independente şi că 122

PSIHODIAGNOSTIC (I)

dispare structura modelului circumplex. După cum s-a sugerat anterioară analiza factorială a acestor scale indică doar o mică varianţă rămasă neexplicată. Plutchik şi colegii săi au arătat că structura modelului circumplex se potriveşte scalelor. Totuşi rezultă o mică semnificaţie psihologică din aceste corelaţii cu scala stimei de sine, şi este posibilă o mai mare cantitate de varianţă a acestor itemi. Aceleaşi argumente e aplică şi scalei emoţionale. Cele 12 termeni trăsături care au fost utilizaţi pentru construcţia scalelor au fost selectaţi doar pe baza faptului că exista un bun acord între judecăţile privitoare la consecinţele emoţiilor. Acest lucru nu este mai mult decât un aspect al validităţii. Ca în cazul EPI o analiză factorială a acestor scale cu notele pentru factorii de personalitate ar releva natura varianţei. În prezent etichetarea lor se face pur şi simplu în termenii validităţii şi teoriei emoţiilor a lui Plutchik. Aceste două exemple de teste construite după modelul circumplex nu par să ofere suficient suport ca bază pentru construcţia testelor. Principale problemă a modelului provine din faptul că chiar dacă există o descriere a datelor aceasta nu este o descriere informativă. Există puţină informaţie care să ducă la concluzia că scala se potriveşte unui circumplex. Modelul va fi util atunci când va fi clar faptul că modele psihometrice normale, cum ar fi o simplă structură de factori, nu se potriveşte complexităţii datelor. XI.7. REPERTORIUL CU TEST GRILĂ Au fost dezvoltat de Kelly (1955) ca metodă de colectarea de date relevante pentru teoria constructelor personale. Aceste instrumente nu sunt teste, deşi ele au fost astfel descrise de unii psihologi. Esenţa teoriei constructelor, care stă la baza acestor instrumente este aceea că oamenii sunt văzuţi ca oameni de ştiinţă care întotdeauna încearcă să dea un sens lumii înconjurătoare. Ei fac acest lucru formând constructe care sunt dependente de experienţa lor cu o specificitate care ţine de propria persoană. Kelly şi teoriile constructiviste (Bannister şi Main, 1968) consideră că testele psihologice standard sunt lipsite de valoare deoarece semnificaţia itemilor este diferită pentru fiecare individ. Repertoriul cu test şi grilă ajută la elucidarea semnificaţiei unor constructe importante din viaţa individului. Descrierea unui repertoriu O listă conţine elemente şi constructe. “Elementele pot fi orice din lume, pentru a cita pe Bannister (1973), filme, deschiderea unei cutii cu brânză, ..., tipuri de trandafiri ş.a.m.d.” Constructele sunt discriminările pe care le face persoana între elementele listei. O astfel de listă ne ajută să elucidăm astfel de constructe, respectiv elementele care sunt relevante. Un exemplu de listă Să presupunem că suntem interesaţi de constructele unei femei despre lume. Îi vom cere să numească 15 persoane importante din viaţa ei, cum ar fi mama, tata, iubit, şeful de la serviciu etc. Acestea vor fi elementele. Constructele vor fi obţinute de la subiect prin gruparea elementelor în trei şi cerând subiectului să ne spună două grupe care sunt apropiate şi diferite de a treia. Astfel, putem obţine că A şi B sunt inteligenţi, în timp ce C este slab. Constructul este: inteligent-slab. Asemănător vom descoperi că D şi E sunt manieraţi în timp ce F este nemilos. Este important ca constructele să fie elaborate de subiect deoarece sunt particulare pentru acesta. Există şi alte metode pentru a elabora constructe, dar ele sunt esenţial echivalente metodei pe care au descris-o. Trebuie menţionat că există mai multe tipuri de metode descrise de Kelly (1955), multe dintre ele au fost rar folosite. Una dintre ele 123

CORNEL HAVÂRNEANU

explorează relaţiile dintre constructe, în mod particular care constructe implică alte constructe (Hinkle, 1965). Analiza listelor Subiecţilor li se poate cere să ierarhizeze fiecare element al fiecărei construct sau să evalueze fiecare element al fiecărui construct. Ambele metode au ca rezultat corelaţii între constructe. Este posibil să vedem ce constructe merg împreună şi bineînţeles cum se plasează indivizi similari în funcţie de aceste constructe. Astfel putem constata că inteligenţa şi cruzimea sunt corelate, şi apoi întorcându-ne la elemente să constatăm, de exemplu, că un profesor de la liceu care este urât de subiect este văzut în mod asemănător în relaţie cu mama. Este clar că această metodă produce informaţii care sunt utile pentru înţelegerea indivizilor particulari şi aceste liste par să fie potrivite pentru utilizare clinică Este dificil însă de stabilit ce se poate face mai departe cu aceste informaţii, având în vedere faptul că listele pentru diferiţi indivizi nu sunt compatibile. Unii cercetători au analizat factorial listele (Slater, 1964, 1976) şi au dezvoltat un set statistic sofisticat de programe computer în acest scop. Totuşi fiind un număr mic de observaţii pentru fiecare listă, erorile statistice ale acestor analize factoriale pot fi atât de mari încât metoda de prelucrare statistică să fie considerată ca fiind îndoielnică. Chiar dacă rezultă factori ei sunt specifici unui individ particular şi de acea prezintă un interes ştiinţific redus. Un număr mare de observaţii se pot face legat de afirmaţia că constructele sunt distincte şi particulare pentru fiecare individ. Acest adevăr pare să fie banal. Toţi avem o experienţă de viaţă care este privată şi care este diferită de a celorlalte persoane. Această experienţă este atât de diferită încât testele sunt lipsite de valoare. Dacă acest aspect ar fi adevărat atunci conversaţia şi înţelegerea dintre oameni ar fi imposibilă. Faptul că lumea exterioară poate fi înţeleasă sugerează că pentru oameni există un nucleu comun de semnificaţii chiar dacă aceste nu sunt identice. Există câteva dificultăţi severe. Dacă constructele individuale folosite sunt atât de diferite atunci ele pot fi elucidate pornind de la informaţiile din liste care sunt particulare pentru un individ, neputând fi combinate cu rezultatele altor subiecţi şi neputându-se face inferenţe despre rezultatele unui subiect comparativ cu cele ale altui subiect. Aceasta distruge scopul ştiinţific normal al descoperirii legilor generale aplicabile tuturor sau unui număr mare de aspecte ale umanităţii. Dacă premisele listelor sunt acceptate putem spune că psihologia ştiinţifică este imposibilă şi că pot fi înţeleşi doar indivizi separat. Ar fi util să stabilim relaţii între măsurarea individului cu ajutorul listelor şi scorurile la anumite variabile din mediu. Chiar dacă ar fi posibil să stabilim asemenea relaţii aceste nu ar fi utile deoarece constructele sunt aprioric diferite unele de altele şi nu ar fi posibile inferenţele sau extrapolările. Doar în domeniul clinic informaţiile rezultate prin folosirea listelor ar putea fi utile. De exemplu o grilă ar putea fi folosită în terapia maritală. S-ar putea constata că soţul îşi vede soţia ca pe o mamă în timp ce soţia îşi vede soţul ca tată. Această incompatibilitate poate crea probleme. Discutarea acestor dificultăţi ar duce la îmbunătăţirea relaţiei. Să presupunem că dificultatea rezidă în certuri frecvente. Deoarece constructele indivizilor sunt diferite nu se pot face generalizări. Simţul comun ar sugera că o ipoteză rezonabilă ar fi să presupunem că atunci când bărbatul doreşte ca soţia să reprezinte imaginea mamei iar femeile imaginea tatălui putem vorbi de o dizarmonie maritală. Dacă această inferenţă este făcută atunci listele, distincte de interviu şi chestionar, care au constructe comune, nu au raţiunea de a exista. Aceste motive stau la baza respingerii listelor pentru măsurare.

124

Related Documents


More Documents from "Itseed Corca"

Psihodiagnostic 1
May 2020 1