11. Test di screening e diagnostici

Sensibilità e specificità: influenza del valore di soglia (cut-off)

OBIETTIVO:

consolidare il concetto di sensibilità e specificità

apprendere i motivi per cui è molto difficile che esista un test con sensibilità e specificità 100%

comprendere come si possa far variare la sensibilità e la specificità di un test, ma solo a prezzo di compromessi

[Vai alla versione Mobile]

Finora abbiamo illustrato le caratteristiche di un ipotetico test che forniva risultati del tipo positivo/negativo oppure sano/malato oppure si/no. Un test di questo tipo, con output binario (in due sole categorie), viene detto «nominale dicotomico»; si tratta di un test «qualitativo» in quanto misura l'esistenza (qualità) di un fenomeno e non la sua ampiezza (quantità).

Esistono anche test semi-quantitativi che generano risultati classificabili in più di due categorie. Ad esempio, attraverso un test si può classificare come segue lo stato di un paziente dopo un trattamento: molto peggiorato, peggiorato, stazionario, poco migliorato, migliorato, molto migliorato. Le variabili di questo tipo, costituite da dati qualitativi suddivisi in più categorie con una direzione chiaramente implicita (es. migliore→peggiore o viceversa), vengono dette «ordinali».

Ancora, i test possono essere di tipo quantitativo, fornendo risultati numerici misurabili su una scala numerica (variabili «continue»), come ad esempio i valori di densità ottica (D.O.) di un test ELISA misurati con lo spettrofotometro.

Il test ELISA (Enzyme-Linked ImmunoSorbent Assay) è test quantitativo che impiega un enzima coniugato a un anticorpo per identificare e quantificare la presenza di anticorpi (o di antigeni) nel siero di sangue o in altri materiali. In caso di positività, l'enzima induce una variazione di colore tanto puù intensa quanto più elevata è la presenza di anticorpi (o di antigeni) nel campione. La variazione di colore viene rilevata attraverso uno strumento (spettrofotometro) e si esprime con un valore numerico attraverso una unità di misura detta assorbanza (o densità ottica).

Per i test quantitativi (ed anche per quelli semi-quantitativi), sorge un problema di interpretazione: occorre stabilire un valore critico o soglia o cut-off, che rappresenta il limite di separazione tra «positività» e «negatività» del test. Ciò corrisponde generalmente alla separazione ammalato/sano.

Epidemiologia veterinaria: sensibilità e specificità, influenza del valore di soglia del test

ESEMPIO. Al di sotto di quale numero di eritrociti/mm³ un animale può essere giudicato anemico? Al di sopra di quale densità ottica ottenuta con un test ELISA un animale è da ritenere malato? Quanto deve essere ingrossato un linfonodo per far sospettare la presenza di una metastasi?

La scelta del cut-off è di estrema importanza: sarai forse sorpreso nell'apprendere che la sensibilità e la specificità possono essere fatte variare a piacimento variando il cut-off. Ora, attraverso un esempio-simulazione, giustifichiamo questa affermazione, e ne discutiamone le implicazioni.

Il mio consiglio: prima di proseguire con questa Unità, assicurati di aver ben saldi i concetti di sensibilità e specificità spiegati nell'unità precedente!

Un esempio-simulazione

Nel grafico 1 sono riportate delle curve teoriche ottenute supponendo di saggiare con un test ELISA quantitativo, sieri di sangue prelevato da un campione di animali sicuramente ammalati e da un campione di animali sicuramente sani.

Vediamo come è stato costruito il grafico.
Sull'asse delle ascisse (orizzontale) è stata riportata la densità ottica (D.O.) restituita dal test. Puoi notare che sono stati ottenuti valori compresi fra 0.2 a 1.6; tieni presente che il valore di D.O. è proporzionale alla quantità di anticorpi presenti nel siero: più anticorpi ci sono nel siero e maggiore è la D.O. Ovviamente, più la D.O. è elevata , maggiore è la probabilità che l'animale sia ammalato.

Sull'asse delle ordinate (verticale) è riportata la frequenza di osservazioni, cioè il numero di animali che hanno evidenziato il titolo corrispondente in ascissa. Si nota che gli animali sani hanno fatto registrare valori di D.O. mediamente più bassi rispetto agli animali malati: la curva verde è infatti più a sinistra rispetto alla rossa. Si nota anche che le due curve si sovrappongono parzialmente, ed è proprio questa area di sovrapposizione che verrà presa in considerazione nella discussione che segue.

Forse ti aspettavi che i sieri degli animali sani facessero registrare valori di D.O. costantemente pari a zero. Oppure, ti aspettavi che gli animali sani facessere registrare valori sempre inferiori rispetto agli ammalati (v. grafico a sinistra). In questi casi, il test sarebbe perfetto e infallibile, e non ci sarebbero problemi di interpretazione.
Purtroppo nella pratica ciò non si verifica, e non devi stupirti che in una certa quota di animali sani possa evocare una risposta «positiva» a un test, e viceversa: questo fenomeno può essere dovuto a una varietà di cause che non è possibile trattare in questa sede.

Torniamo al Grafico 1. Il problema è quello di stabilire un limite di separazione fra e sani e malati, ossia di stabilire il valore di D.O. al di sopra del quale l'animale viene ritenuto malato e al di sotto del quale viene ritenuto sano. Per essere più chiari: guarda l'asse delle ascisse e rispondi alla seguente domanda: a partire da quale valore di D.O. classifichi come «ammalato» un animale?

Supponi di adottare come cut-off il valore di 1.0. Ciò significa che dichiarerai come «sano» ogni animale con D.O. ≤1.0, e dichiarerai «malato» ogni animale con D.O. >1.0.

Considera il sottostante Grafico 2: con un cut-off=1, suddividi gli animali in due classi: test-positivi e test-negativi. Nota che, in realtà, fra quelli classificati come test-negativi sono compresi animali negativi veri (area verde) e animali negativi falsi (area tratteggiata viola). Analogamente, fra i test-positivi sono compresi animali positivi veri (area rosa) e animali positivi falsi (area tratteggiata gialla).

Riassumendo: adottando un cut-off=1, si ottengono quattro classi di animali: (a) positivi veri, (b) positivi falsi, (c) negativi falsi, (d) negativi veri. Sicuramente ricordi che queste quattro classi corrispondono a quelle già viste nell'Unità precedente in cui, attraverso la tabella di contingenza, è stata definita la sensibilità e la specificità di un test:

Finora abbiamo simulato l'ipotesi di adottare un cut-off=1. Ma che cosa succede adottiamo un cut-off diverso? Osserva ancora il Grafico 2, e immagina di aumentare il cut-off (spostando verso destra la linea blu) o di diminuirlo (spostando la linea verso sinistra).

Se aumenti il cut-off, ottieni i seguenti effetti:

il numero complessivo di test-positivi diminuisce, e aumenta quello di test negativi
aumenta l'area d, e anche l'area c;
diminuisce l'area a, e anche l'area b.

Di conseguenza, la sensibilità [a/(a+c)] diminuisce, e la specificità [d/(b+d)] aumenta.

Se diminuisci il cut-off, ottieni i seguenti effetti:

il numero complessivo di test-positivi aumenta, e diminuisce quello di test negativi
diminuisce l'area d, e anche l'area c;
aumenta l'area a, e anche l'area b.

Di conseguenza, la sensibilità [a/(a+c)] aumenta, e la specificità [d/(b+d)] diminuisce. Potresti scegliere valori di cut-off tali addirittura da massimizzare la sensibilità oppure la specificità come illustrato nei grafici che seguono:

Nel primo caso (Sensibilità=1) il cut-off è stato abbassato a circa 0.8: sotto questa nuova ipotesi, il test riesce a individuare tutti i soggetti ammalati essendo il valore dell'area c=zero. Però, come contropartita, hai un aumento dell'area b (positivi falsi). Poiché c=0, la sensibilità è massima, ossia è pari a 1; questo effetto favorevole è bilanciato da una diminuzione della specificità.

Nel secondo caso (Sensibilità=1) il cut-off è stato alzato a circa 1.3: sotto questa nuova ipotesi, il test riesce a individuare tutti i soggetti sani, essendo il valore dell'area b=zero. Però, come contropartita, hai un aumento dell'area b (negativi falsi). Poiché b=0, la specificità raggiunge il valore massimo di 1; questo effetto favorevole è bilanciato da una diminuzione della sensibilità.

In genere è conveniente scegliere un cut-off di compromesso (es. del Grafico 1): sia la sensibilità che la specificità hanno un valore <1, e perciò si otterrà una quota di risultati positivi falsi e di negativi falsi. Questo inconveniente è inevitabile, e deriva dalla parziale sovrapposizione delle due curve di distribuzione (sani e malati).

Per riassumere:

diminuendo il cut-off di un test, aumenta la sensibilità a scapito della specificità;
aumentando il cut-off di un test, aumenta la specificità a scapito della sensibilità.

ESEMPIO. Langenbach e coll. (2001) hanno calcolato sensibilità e specificità del test "Esame clinico dei linfonodi" di cani e gatti al fine di diagnosticare metastasi di tumori solidi. L'esame clinico è stato posto a raffronto con un test di riferimento (golden test) rappresentato dall'esame istologico dei linfonodi.
È noto che, durante le malattia neoplastiche, si possono verificare tumefazioni e ingrossamenti dei linfonodi regionali, e l'ingrossamento è rilevabile mediante una semplice palpazione. Uno dei problemi connessi con questa tecnica è rappresentato dalla valutazione dell'entità dell'ingrossamento e dalla sua interpretazione. In particolare: è sufficiente un modico ingrossamento oppure l'aumento di volume del linfonodo deve essere notevole?
Gli Autori hanno classificato la modificazione del volume in 3 categorie: (1) no ingrossamento; (2) ingrossamento lieve; (3) ingrossamento notevole. Questo tipo di classificazione ha fatto sorgere il quesito se gli animali appartenenti la categoria (2) (ingrossamento moderato) fossero da assegnare alla categoria degli ammalati o dei non ammalati. Gli Autori hanno applicato due criteri di interpretazione: interpretazione permissiva e interpretazione severa. Nel primo caso gli animali con linfonodi lievemente ingrossati venivano classificati come "sani", nel secondo come "malati". Ciò corrisponde proprio a una variazione del cut-off.
In sintesi, sono stati ottenuti i seguenti risultati:

Come si vede, l'interpretazione permissiva (corrispondente a un innalzamento del cut-off) ha fatto registrare una sensibilità inferiore e una specificità superiore rispetto alla interpretazione severa (corrispondente a un abbassamento del cut-off).

Privilegiare la sensibilità o la specificità?

Purtroppo a questa domanda non può essere data una risposta univoca. Come abbiamo ora dimostrato, il valore di cut-off influenza sia la sensibilità che la specificità del test. Esso viene scelto in base a una serie di considerazioni: ad esempio, deve essere ben nota la storia naturale della malattia, nonché le conseguenze sanitarie ed economiche dei negativi falsi e dei positivi falsi. Nel caso di alcune malattie infettive, talvolta anche un solo animale falso negativo può risultare particolarmente pericoloso, in quanto escretore dell'agente di malattia e quindi disseminatore del contagio

ESEMPIO. Nello screening effettuato sulle persone donatrici di sangue è necessario adottare test provvisti della massima sensibilità. Infatti, è assolutamente indispensabile tutelare chi riceve la donazione e quindi non si può correre il rischio di trasfondere sangue infetto (risultato falsamente negativo ai test di sicurezza). Su questa base, diventa tollerabile la distruzione di una certa quota di campioni non infetti (risultati falsamente positivi ai test di sicurezza).

Nel caso di malattie rare, conviene utilizzare un test ad alta sensibilità, altrimenti si rischia di non individuare i pochi casi presenti; al contrario, se la prevalenza della malattia è elevata, è generalmente più utile un test altamente specifico: infatti vanno assolutamente contenuti i positivi falsi al fine di non esaurire rapidamente le risorse per le richieste diagnostiche o terapeutiche del gran numero di animali positivi (veri e falsi).

In epidemiologia clinica, nella scelta di un test diagnostico, si dovrebbero sempre considerare le caratteristiche di sensibilità e specificità e privilegiare l'una o l'altra a seconda delle circostanze.
Un test sensibile dovrebbe essere scelto quando le conseguenze di una mancata diagnosi sono particolarmente gravi (es. malattie a esito solitamente mortale, ma che possono essere efficacemente curate).
I test sensibili sono utili anche durante il processo diagnostico iniziale, al fine di ridurre il ventaglio di possibilità (diagnosi differenziale) quando esso è ampio. In tal caso, il test sensibile viene applicato soprattutto allo scopo di escludere una o più malattie. Infatti, un test sensibile è di maggior aiuto al clinico quando fornisce un risultato negativo.

Un test specifico è particolarmente utile per confermare una diagnosi già effettuata con altri mezzi. Infatti, un test specifico raramente è positivo in assenza della malattia. I test altamente specifici sono particolarmente utili quando un risultato falso positivo risulta particolarmente dannoso (sotto l'aspetto organico, emotivo per il proprietario, finanziario ecc.). In sostanza, un test molto specifico è di maggior aiuto al clinico quando fornisce un risultato positivo.

AFTER HOURS: Un cutoff molto ben definito

AFTER HOURS: La vita sottoposta a un test dicotomico... irlandese

NELLA PROSSIMA UNITÀ:
si parla di due ulteriori caratteri fondamentali di ogni test: il valore predittivo di un test positivo e il valore predittivo di un test negativo.

• TEST ARGOMENTI CAPITOLO 11 • FIRMA IL GUESTBOOK, PLEASE!