Proprietà psicometriche dei test in ambito forense

Proprietà psicometriche dei test in ambito forense
Giacomo Piperno

*A cura di Riccardo Grasso

È dovere di uno psicologo forense essere a conoscenza dei diversi test che vengono impiegati durante una perizia. Il test non è un elemento in sé sufficiente per poter identificare in tutto e per tutto il costrutto sotto esame. È per questo che in ambito forense i consulenti si avvalgono di una batteria di test ed in parallelo anche del colloquio clinico. Sia i test che il colloquio sono strumenti validi, ma soggetti a limitazioni. Il colloquio, se svolto in maniera errata, può essere per esempio bersaglio dei bias del clinico. Un test, d’altro canto, non potrà mai scovare aspetti critici che vengono alla luce con un colloquio clinico. Questo perché i test si avvalgono spesso di domande standardizzate e procedure fisse. Tuttavia, il loro utilizzo risolve sicuramente il problema dei bias, permettendo di trarre conclusioni su un individuo sottoposto al test limitando l’interpretazione personale del clinico. Pertanto, un utilizzo di entrambi gli strumenti fornisce un quadro psicologico tanto completo quanto più oggettivo possibile. Lo psicologo deve sapere anche quali possono essere le limitazioni di un test se applicato ad un soggetto che non corrisponde al target per il quale il test è stato messo a punto, considerare aspetti linguistici e culturali, fasi dello sviluppo, eventuali infermità e quant’altro. In tal caso, lo psicologo deve saper proporre e valutare possibili alternative al test che non può (o che non dovrebbe) essere somministrato. Nel caso questa proposta non venisse accolta dai colleghi, lo psicologo potrà far mettere a verbale le proprie perplessità.

Affidabilità e Validità come proprietà psicometriche

Nell’ambito dei test psicologici, l’affidabilità può essere calcolata mediante più metodi. Il primo metodo, detto test-retest, consiste nel somministrare due volte lo stesso test (trascorso un lasso di tempo sufficientemente lungo) allo stesso soggetto. In questo modo si può vedere se il test risulta stabile nel tempo. Ottenendo risultati simili si avrà così un coefficiente di stabilità alto. Il secondo metodo, delle forme parallele, consiste nel somministrare al soggetto due test diversi, l’uno equivalente all’altro dal punto di vista di lunghezza, item e costrutto misurato. Questo metodo consente di indagare il grado di equivalenza tra due forme dello stesso test. Un altro indice di attendibilità del test è dato dall’alfa di Cronbach. Ciò stabilisce il grado di correlazione tra gli item che fanno parte di un test. È un indice di coerenza interna, vale a dire che più gli item sono correlati fortemente, più daranno un contributo nel misurare il costrutto cercato.

La validità di un test indica la capacità di un test di misurare proprio quello che intende misurare. Un test può essere affidabile, ma non essere per nulla valido. Vi sono varie tipologie di validità:

  • La validità di costrutto è la misura di quanto efficacemente è stata tradotta la teoria (o il modello) di riferimento in concetti concreti (costrutto).
  • La validità di criterio quantifica la correlazione esistente tra il test utilizzato ed altre variabili, già validate, che intendono misurare lo stesso costrutto.
  • La validità di contenuto fa riferimento al grado in cui gli elementi del test sono rappresentativi del costrutto analizzato.
  • Per validità incrementale si intende la capacità di un test, se aggiunto ad un altro, di aumentarne la capacità predittiva del costrutto cercato.
  • La validità convergente è l’opposto della validità discriminante (è dimostrata quando vi è una correlazione alta con misure che dovrebbero essere correlate).

Test psicologici in ambito forense

Per rispondere al quesito posto dal giudice, il CTU deve stabilire una serie di misure atte a rispondere a tale quesito. Generalmente, si cerca di delineare un profilo psicologico dell’esaminato, vedendo se sono presenti eventuali disturbi psichici; si cerca inoltre di determinare se il soggetto risulta (o risultava) idoneo a rendere testimonianza, analizzando abilità generiche (quali capacità di comprensione, memoria, source monitoring, attenzione) e specifiche (capacità di organizzare e riferire un ricordo e presenza di eventuali suggestioni che possono aver agito).

Test psicologici in ambito forense

Tra i molteplici test più utilizzati in ambito forense, tra i test di personalità spiccano l’MMPI-2 e il 16PF Cattell; tra i test proiettivi troviamo il Rorschach e i test grafici; le scale WAIS e il Test di Intelligenza Breve (TIB) risultano essere i più utilizzati nella ricerca tra i test di livello; il Bender-Gestalt risulta essere l’unico test visuo-motorio impiegato; nella valutazione neuropsicologica spicca il Test della figura complessa di Rey; per misurare ansia e depressione vengono impiegati l’IPAT anxiety scale, IPAT depression scale e BDI.

Test MMPI-2

Il Minnesota Multiphasic Personality Inventory-2 (MMPI-2; Butcher et al., 1989) è uno dei test della personalità maggiormente utilizzati al mondo. Il test comprende, nella sua totalità, 567 items. Pertanto, per completare il test sono generalmente richiesti tra i 30 e 60 minuti, nonostante possa richiedere fino a 2 ore per individui con alti livelli di distrazione o scarse capacità di lettura. L’MMPI-2 fornisce dei punteggi che possono essere raggruppati in sei categorie principali (Hogan, T., 2013): a) Indici di validità b) Scale cliniche c) Scale di contenuto d) Scale supplementari e) Item critici f) Codici (“code types”).

Test 16PF

Una seconda misura di personalità, in un range normale (quindi non psicopatologico), è il test dei 16 fattori di personalità ideato da Cattell. Un’importante caratteristica è la sua forte base scientifica. È stata impiegata, in anni di ricerca, l’analisi fattoriale per formulare i 16 fattori di personalità. Ciò implica che il test è stato sviluppato con l’intenzione di individuare le basi strutturali della personalità (i fattori), e che l’ideatore non è quindi partito da una sua idea iniziale di quali dovessero essere le dimensioni della personalità. Il test risulta essere uno degli strumenti che misurano costrutti non patologici tra i più utilizzati. (H. E. P., Cattell, & Mead., 2008). Il tempo di somministrazione è relativamente breve, si aggira dai 35 ai 50 minuti, ma sono reperibili anche versioni più brevi, come la 16PF Select per la quale sono richiesti 20 minuti, ma viene utilizzata solamente per la selezione del personale; poi si può trovare la 16PF Express (Gorsuch, 2006) per la quale sono sufficienti 15 minuti. Tutte queste misure sono somministrabili a soggetti dai 16 anni in su. È comunque reperibile un test per gli adolescenti (dai 12 ai 18 anni), il 16PF Adolescent Personality Questionnaire (Schuerger et al., 2001). Il 16PF misura la personalità su più livelli. I 16 fattori sono i tratti primari (I livello). Questi fattori sono quelli che delineano le differenze più basilari nella personalità, e sono fattori organizzati su una dimensione (ad esempio, un valore basso nel fattore “coscienziosità” indica una tendenza a non seguire le regole; al contrario, un valore alto indica una tendenza a conformarsi con le norme sociali e le regole). Partendo da questi fattori, sempre tramite analisi fattoriale, i ricercatori hanno riunito questi tratti in dei cluster più ampi, che potessero contenere delle strutture di personalità ad un livello più elevato. Risultati di queste analisi hanno fornito così 5 fattori, denominati fattori globali (II livello). Questi sono congruenti con i Big Five.

Test Rorschach

Più che un solo test di Rorschach, si può dire che di questo test ne esistono molteplici, tanti quanti i metodi di interpretazione. Tra i tanti metodi, in Italia i più utilizzati sono il metodo della Scuola Romana di Rorschach (messo a punto da Rizzo) ed il metodo svizzero-francese (ideato a Marguerite Loosli-Usteri; Arcangeletti, 2013). Tuttavia, il metodo messo a punto da Exner (1974), il Comprehensive Sistem (CS), risulta particolarmente importante sia dal punto di vista storico che pratico. Dal punto di vista storico, il CS ha risollevato nella società scientifica un interesse al tempo scemato per il test di Rorschach.

Test Rorschach

Dal punto di vista pratico, questo sistema ha reso possibile un cambiamento di prospettiva del test stesso, da tecnica di assessment psicologico a test. Per tecnica si intende uno strumento utilizzato (in questo caso) in ambito clinico, al fine di fornire una valutazione sul funzionamento psicologico. Per questa attenzione alla sua utilità clinica, non si tiene in tutto per tutto conto delle proprietà psicometriche dello strumento; per test, invece, si intende una misurazione di livello. Questo deve attenersi scrupolosamente ad una serie di accortezze statistiche (ad esempio la standardizzazione delle risposte) e godere di proprietà psicometriche sufficienti.

Le scale Wechsler

David Wechsler sentì l’esigenza di sviluppare un test di intelligenza che fosse orientato verso l’adulto, in contrasto con l’orientazione verso il bambino dello Stanford-Binet, il test d’intelligenza impiegato allora. Nonostante questa orientazione, lo Stanford-Binet veniva impiegato anche con gli adulti. Inoltre, forniva un risultato globale, mentre le scale Wechsler forniscono risultati separati per manifestazioni di abilità mentali diverse. Nasce nel 1939 il Wechsler Bellevue Intelligence Scale, rivisto nel 1955 con il nome di Wechsler Adult Intelligence Scale (WAIS), oggi alla sua quarta edizione (WAIS-IV; Wechsler, 2008); nel 1949 nasce il Wechsler Intelligence Scale for Children (WISC), oggi alla sua quinta edizione (WISC-V; Wechsler, 2014). Esiste anche un test per bambini in età prescolare, il Wechsler Preshool and Primary Scale of Intelligence (WPPSI). La famiglia dei test di Wechsler è ampia, include tra gli altri test di memoria e test di profitto (achievement test). (Hogan,2013)

Test WAIS-IV

Questo test è stato standardizzato su un campione normativo di 2450 persone, suddivise in diverse fasce d’età: 16-17, 18-19, 20-24, 25-29, 30-34, 35-44, 45-54, 55-64, 65-69, 70- 74, 74-79, 80-84, 85-89. Per ogni fascia di età sono stati inclusi circa 200 casi. Sono stati esclusi soggetti affetti da certe patologie, come Alzheimer, daltonismo, perdita di udito a-specifica… Pertanto le norme sono rappresentative di adulti privi di disturbi sensoriali, ed in una soddisfacente forma fisica e mentale. La WAIS-IV segue una forma gerarchica. Ad occupare la parte alta è la Full Scale IQ (FSIQ); a seguire vi è un livello intermedio dato da quattro indici, che sono l’indice di comprensione verbale, di ragionamento visuo-percettivo, indice di memoria di lavoro e indice di velocità di elaborazione; a loro volta, questi indici vengono da una combinazione di 2-3 sub-test. I quattro indici sono stati ottenuti per analisi fattoriale dei subtest (Hogan, 2013).

Test WISC-IV

La struttura della WISC è molto simile a quella della WAIS sia per quanto riguarda la struttura del test, sia per la finalità. Nonostante gli indici siano gli stessi della WAIS, vi è una differenza nei sub-test, che rende la composizione degli indici leggermente diversa. È disponibile anche una estensione del test, chiamata WISC integrata, che include altri sub-test ideati al fine di indagare vari processi cognitivi, principalmente nei bambini disabili. Un’altra differenza che può sembrare banale con la WAIS è la difficoltà delle domande presentate. Per domande di comprensione verbale vengono utilizzate parole più semplici, per domande di competenze matematiche si chiedono problemi più elementari. Vi è inoltre un certo grado di sovrapposizione tra soggetti che ottengono un punteggio alto nel WISC, e soggetti che ottengono un punteggio basso nel WAIS. La standardizzazione è stata condotta su un campione normativo di 2200 bambini, selezionata per rappresentare al meglio la popolazione degli Stati Uniti (Hogan, 2013).

Test Bender-Gestalt

Il Bender- Gestalt Test è stato ideato da Lauretta Bender nel 1939, come un test che stimasse lo sviluppo visuo-motorio in bambini tra i 4 e gli 11 anni. Tale sviluppo visuo-motorio va di pari passo con lo sviluppo mentale del bambino. Il test viene anche impiegato su soggetti adulti. La popolarità di questo strumento è stata documentata in diversi studi, anche in campo forense in cui è stato stimato come settimo test più impiegato (almeno nel 1996). È però probabile che la popolarità di questo strumento sia scesa negli ultimi anni, come evidenziato da Piotrowski (2016), il quale ha trovato un declino nell’affidamento in questo strumento per le pratiche di assessment dal 2008. L’autore ipotizza che tale cambiamento possa essere una conseguenza del criticismo accademico, o della proliferazione di nuovi strumenti psicologico-educativi disponibili agli psicologi. Contrariamente a questa tendenza, l’autore afferma che la ricerca nel campo del Bender non si è fermata, e prosegue efficacemente in tutto il mondo. L’assenza di un utilizzo sistematico di sistemi di scoring da parte degli psicologi clinici (Efird, 1984) negli anni passati ha portato allo sviluppo di alcuni sistemi che hanno proposto un metodo standard per registrare le risposte al test. Tra questi metodi troviamo il sistema di Koppitz (1975), studiato per essere applicato a bambini tra i 5 ed i 10 anni; un altro metodo è quello di Reichenberg e Raphael (1992), l’Advanced Psychodiagnostic Interpretation (API), che intende ampliare lo scopo degli indicatori di personalità del Bender. Nella sua versione aggiornata (Raphael, & Golden, 1998), il sistema propone 207 distorsioni possibili delle figure, per le quali offre un metodo di scoring oggettivo.

Blog Attachment

Lascia un commento