Découvrez des millions d'e-books, de livres audio et bien plus encore avec un essai gratuit

À partir de $11.99/mois après l'essai. Annulez à tout moment.

WISC-V : Examen clinique de l'intelligence de l'enfant: Fondements et pratiques de l'échelle de Wechsler
WISC-V : Examen clinique de l'intelligence de l'enfant: Fondements et pratiques de l'échelle de Wechsler
WISC-V : Examen clinique de l'intelligence de l'enfant: Fondements et pratiques de l'échelle de Wechsler
Livre électronique543 pages4 heures

WISC-V : Examen clinique de l'intelligence de l'enfant: Fondements et pratiques de l'échelle de Wechsler

Évaluation : 5 sur 5 étoiles

5/5

()

Lire l'aperçu

À propos de ce livre électronique

Cet ouvrage vous aidera à maîtriser la version la plus récente de l'échelle d'intelligence de Wechsler pour les enfants (WISC) afin qu'il n'y ait plus jamais d’erreurs dans l'interprétation de vos résultats.

L’échelle d’intelligence de Wechsler pour les enfants (WISC) est à, l’heure actuelle, le test d’intelligence le plus largement utilisé par les psychologues francophones. Et le professeur Jacques Grégoire est le spécialiste francophone de ce domaine. En effet, il a été le premier à rédiger un ouvrage de référence en français consacré à ce test, à destination des formateurs et praticiens. De plus, il a été membre du comité scientifique américain qui a supervisé le développement de la cinquième version du test, le WISC-V, et a collaboré à l’adaptation française de celui-ci. C’est donc tout naturellement que Jacques Grégoire nous propose, aujourd’hui, un ouvrage consacré à la version la plus récente du WISC.

Grâce à une longue pratique clinique de ce test, Jacques Grégoire présente, dans cet ouvrage, une méthode rigoureuse d’interprétation des résultats. Cette méthode s’appuie sur une connaissance approfondie des bases théoriques et des propriétés métriques des scores obtenus au test. Elle permettra aux praticiens d’assurer pleinement leur rôle d’interprètes des résultats, et de tirer des informations pertinentes des protocoles du WISC-V.

Jacques Grégoire nous livre de manière méthodique ses connaissances afin que vous puissiez utiliser le WISC de la manière la plus appropriée possible.

À PROPOS DE L'AUTEUR

Jacques Grégoire est docteur en psychologie, professeur à l’Université catholique de Louvain (Belgique) et vice-recteur pour les sciences humaines de cette même université. Auteur et coauteur de nombreux articles et ouvrages scientifiques, il a aussi assuré la responsabilité scientifique de l’adaptation en français de différentes échelles de Wechsler et de plusieurs autres tests. Aux Editions Mardaga, il est également directeur de collection "PSY - Évaluation, mesure, diagnostic".
LangueFrançais
ÉditeurMardaga
Date de sortie25 mars 2021
ISBN9782804709600
WISC-V : Examen clinique de l'intelligence de l'enfant: Fondements et pratiques de l'échelle de Wechsler

En savoir plus sur Jacques Grégoire

Auteurs associés

Lié à WISC-V

Livres électroniques liés

Psychologie pour vous

Voir plus

Articles associés

Catégories liées

Avis sur WISC-V

Évaluation : 5 sur 5 étoiles
5/5

1 notation0 avis

Qu'avez-vous pensé ?

Appuyer pour évaluer

L'avis doit comporter au moins 10 mots

    Aperçu du livre

    WISC-V - Jacques Grégoire

    Introduction


    Le présent ouvrage est le lointain descendant de mon premier livre Évaluer l’intelligence de l’enfant paru en 1992. Il portait sur la pratique clinique du WISC-R et avait pour ambition de fournir aux praticiens les informations conceptuelles et psychométriques nécessaires pour interpréter correctement les résultats de ce test d’intelligence pour enfants. Depuis lors, les révisions du WISC se sont succédé : WISC-III, WISC-IV et à présent WISC-V. Nos connaissances à propos de l’intelligence et de sa mesure ont également évolué. À chaque révision du WISC, mon ouvrage a été remis sur le métier pour prendre en compte les changements intervenus dans l’organisation, le contenu et les qualités psychométriques du test. En conséquence, l’ouvrage actuel est bien différent de celui de 1992. Mais sa philosophie générale n’a pas changé. Il s’agit toujours de donner aux praticiens les connaissances nécessaires pour utiliser le WISC de manière appropriée et extraire des protocoles le maximum d’informations valides et utiles pour la compréhension des personnes examinées.

    Par rapport à son prédécesseur utilisé par les praticiens du début des années 90, le WISC-V a considérablement changé. Il est à présent sous-tendu par un modèle bien étayé de la structure de l’intelligence. Le QI Total fournit aujourd’hui une meilleure estimation de l’intelligence globale, car il se base sur un échantillonnage plus large et plus pertinent des compétences intellectuelles. Quant aux cinq indices, ils représentent des composantes plus homogènes correspondant chacune à une des grandes facettes du fonctionnement intellectuel. Leur interprétation est dès lors plus simple que par le passé. Par ailleurs, des indices complémentaires peuvent être calculés, dont les plus importants, en l’occurrence l’Indice d’Aptitude Générale et l’Indice Non Verbal, permettent de surmonter certaines limites du QI Total. Les informations contenues dans le manuel du WISC-V se sont considérablement étoffées. Elles permettent aux praticiens de réaliser une analyse beaucoup plus fine des scores observés. Cette profusion d’informations a cependant son revers. Les praticiens doivent prendre le temps de s’approprier ces nombreuses informations, souvent complexes, et les intégrer dans leur procédure d’interprétation des résultats. Malheureusement, pressés par les contraintes temporelles, nombre de praticiens ignorent tout ce que le WISC-V peut leur offrir et se cantonnent à une procédure d’interprétation a minima, calquée sur les habitudes acquises avec les versions précédentes du WISC.

    Conscient de cette réalité, j’ai conçu cet ouvrage comme un guide à destination des praticiens et des étudiants. Il débute par une analyse des fondements théoriques et psychométriques du WISC-V. Sur cette base, une méthodologie rigoureuse d’interprétation est ensuite proposée. Elle vise à intégrer l’ensemble des informations récoltées lors de la passation du test pour comprendre le fonctionnement intellectuel de la personne évaluée. La démarche que nous proposons fait appel au jugement des praticiens, car chaque patient est unique et ses performances au WISC-V présentent des caractéristiques qui lui sont propres. Il ne s’agit donc pas d’analyser les protocoles de manière mécanique et de faire entrer de force les individus dans des grilles préétablies. Il est, au contraire, nécessaire de saisir le fonctionnement intellectuel particulier de chaque individu en suivant une démarche pas à pas qui permet d’examiner l’ensemble des informations recueillies à l’occasion de la passation du WISC-V et de les intégrer dans le cadre général de l’examen clinique.

    Le premier chapitre replace le WISC-V dans le cadre clinique de son utilisation. Pourquoi mesurons-nous l’intelligence ? Quels sont les facteurs qui affectent l’utilisation du WISC-V et l’interprétation des résultats ? Quelles sont les conditions d’une utilisation correcte de ce test ? Le second chapitre aborde les fondements théoriques du WISC-V. Que représentent le QI et les indices du WISC-V ? Quelles sont leurs bases théoriques ? Le modèle de l’intelligence qui sous-tend ces mesures est confronté à plusieurs autres modèles de l’intelligence, permettant ainsi de se rendre compte de sa pertinence et de son actualité.

    Les quatre chapitres suivants se centrent sur le WISC-V et sur son utilisation clinique. Le chapitre 3 présente les caractéristiques psychométriques du test, en portant une attention particulière à sa validité et à sa fidélité. Les résultats des analyses factorielles françaises et américaines sont discutés de manière approfondie. La structure factorielle du WISC-V conditionne en effet l’interprétation des scores composites qui sont calculés à partir des notes standard aux subtests. Le chapitre 4 est consacré aux scores composites, en l’occurrence le QIT et les indices. Que mesure chacun de ces scores ? Comment pouvons-nous les interpréter ? La question de la dispersion des notes qui interviennent dans le calcul des scores composites fait l’objet d’une discussion approfondie qui s’appuie sur l’analyse de la dispersion des scores de l’échantillon d’étalonnage. Les caractéristiques des résultats au WISC-V des sujets toutvenant permettent en effet de relativiser certaines observations faites en contexte clinique. Le chapitre 5 aborde l’analyse des résultats aux subtests. Pour chacun de ceux-ci, une synthèse des connaissances actuelles à propos de leurs qualités métriques et des caractéristiques cognitives et non cognitives qu’ils mesurent est proposée. Le chapitre 6 est, quant à lui, consacré à l’utilisation pratique des connaissances et des principes méthodologiques exposés dans les chapitres précédents. Une méthode systématique d’analyse des protocoles du WISC-V y est décrite. Elle permet une exploitation optimale des résultats. Cette méthode est illustrée par deux études de cas.

    Le septième chapitre s’éloigne de l’analyse des résultats individuels pour s’intéresser aux différences intergroupes qui peuvent être observées au WISC-V. Sont abordées successivement les différences liées au genre, au milieu social et aux générations (l’effet Flynn). Enfin, une dernière section aborde le problème des biais socioculturels dans l’examen de l’intelligence. Après avoir analysé les différentes formes de biais, plusieurs manières de prendre en compte les différences socioculturelles dans le cadre de l’examen intellectuel sont examinées.

    Je profite de cette introduction pour remercier les ECPA avec qui je collabore depuis plus de 25 ans. Je leur sais gré de m’avoir permis de tirer profit des données d’étalonnage du WISC-V qui sont une véritable mine d’informations. Par ailleurs, je ne remercierai jamais assez mon épouse qui m’a soutenu et supporté durant mon travail d’écriture.

    Chapitre 1

    Le WISC-V, outil d’examen clinique de l’intelligence


    Les échelles de Wechsler doivent être utilisées avec intelligence (Kaufman, 1979). Quelles que soient leurs qualités intrinsèques, ce ne sont que des outils au service des praticiens qui ont la responsabilité d’en faire le meilleur usage possible. Le WISC-V ne peut être appliqué, ni interprété de manière mécanique par un psychologue réduit à l’état de simple technicien. C’est pour cette raison que nous avons choisi d’entamer ce premier chapitre en replaçant le WISC-V au sein de l’examen clinique et de la relation entre le psychologue et son patient.

    1. Pourquoi évaluer l’intelligence ?

    Avant d’entreprendre l’examen de l’intelligence d’une personne, le praticien doit d’abord s’interroger sur la finalité de cet examen. Quel type d’information veut-il recueillir et pour quel usage ? Il n’est pas rare que des examens intellectuels soient réalisés sans réelle nécessité ou au détriment d’autres examens plus utiles. Inversement, certains praticiens ne réalisent jamais d’examen intellectuel parce qu’ils n’en perçoivent pas la nécessité et se privent ainsi, par ignorance, d’informations utiles. Il est par conséquent indispensable de rappeler les fonctions que peut remplir un examen intellectuel. Dans la suite de cette section, nous allons examiner tour à tour quatre fonctions essentielles remplies par les tests d’intelligence : le diagnostic de certains troubles, la prédiction de performances futures, le recueil d’informations cliniques et la satisfaction d’exigences administratives.

    1.1. Un index de l’efficience cognitive actuelle et future

    Les mesures de l’intelligence sont, depuis longtemps, considérées comme de bons prédicteurs des apprentissages scolaires, des performances professionnelles et de l’adaptation sociale (Brody, 1997 ; Schmidt & Hunter, 1998 ; Sternberg, Grigorenko & Bundy, 2001). En réalité, il n’existe pas de mesure psychologique mieux corrélée avec ces différents critères. Pour le praticien, les mesures intellectuelles se révèlent dès lors très utiles dans le cadre d’activités de conseil, d’orientation et de sélection. Elles sont également intéressantes dans les examens cliniques comme indices des capacités adaptatives de l’individu.

    À titre d’illustration, le tableau 1 fournit les résultats d’une méta-analyse (Zimmerman & Woo-Sam, 1997) des relations entre le QI mesuré avec le WISC-III et les performances scolaires en lecture et en mathématiques. Ces dernières ont été évaluées à l’aide de divers tests d’acquis scolaires couramment utilisés aux États-Unis. On peut constater que les corrélations les plus élevées sont observées avec les performances en mathématiques. Les corrélations avec les performances en lecture sont un peu plus faibles. Cette différence s’explique par l’hétérogénéité des mesures de la lecture qui, en général, combinent des mesures de décodage des mots et de compréhension de phrases. Alors que la compréhension des informations lues est étroitement liée à l’intelligence (Carroll, 1993), le décodage des mots, c’est-à-dire la conversion des informations écrites en informations phonologiques n’est, quant à lui, que faiblement lié à l’intelligence (Stanovich & Siegel, 1994). On observe d’ailleurs des sujets intellectuellement surdoués souffrant de dyslexie, c’est-à-dire d’un déficit du mécanisme de décodage des mots, et des sujets handicapés mentaux hyperlexiques (Temple, 1997), c’est-à-dire capables de lire facilement les mots sans pour autant accéder au sens des phrases lues.

    Tableau 1 – Corrélations entre le QI Total au WISC-III et divers tests d’acquis scolaires (d’après Zimmerman & Woo-Sam, 1997).

    Les prédictions basées sur les mesures obtenues aux tests d’intelligence doivent toutefois être formulées avec prudence car, même élevées, les corrélations de ces mesures avec les performances scolaires et professionnelles sont loin d’être parfaites. D’autres facteurs que l’intelligence interviennent dans la réussite des apprentissages et de la vie professionnelle. Certains de ces facteurs peuvent être évalués en même temps que l’intelligence, mais la possible influence d’autres facteurs nous est inconnue au moment de l’examen. Nous devons dès lors tenir un raisonnement probabiliste, et non déterministe, à propos des conséquences futures du niveau intellectuel des sujets examinés.

    1.2. Un critère de diagnostic différentiel

    La mesure de l’intelligence, souvent exprimée sous la forme d’un QI, fait partie des critères définissant certains troubles mentaux. C’est le cas, par exemple, du Handicap intellectuel (tableau 2) dont il constitue un des symptômes de base.

    A.Déficit des fonctions intellectuelles comme le raisonnement, la résolution de problèmes, la planification, l’abstraction, le jugement, l’apprentissage scolaire et l’apprentissage par l’expérience, confirmés par l’évaluation clinique et les tests d’intelligence individuels standardisés.

    B.Déficit des fonctions adaptatives qui se traduit par un échec dans l’accession aux formes habituelles de développement socioculturel permettant l’autonomie et la responsabilité sociale. Sans assistance au long cours, les déficits adaptatifs limitent le fonctionnement dans un ou plusieurs champs d’activité de la vie quotidienne comme la communication, la participation sociale, l’indépendance, dans des environnements variés tels que la maison, l’école, le travail, la collectivité.

    C.Début du déficit intellectuel et adaptatif pendant la période de développement.

    Tableau 2 – Critères diagnostiques du Handicap intellectuel (American Psychiatric Association, 2015, pp. 35-36).

    Le QI peut aussi être utilisé comme critère pour établir le diagnostic différentiel. Dans ce cas, il ne fait pas partie des symptômes du trouble, mais permet seulement de le distinguer d’autres troubles au tableau clinique voisin. Le cas le plus fréquent est celui du diagnostic du trouble spécifique des apprentissages. Selon le DSM-V (American Psychiatric Association, 2015, p. 76), un des critères est que « les difficultés d’apprentissage ne sont pas mieux expliquées par un handicap intellectuel ». Il est précisé plus loin (p. 80) que

    le trouble spécifique des apprentissages affecte l’apprentissage chez des individus qui d’autre part présentent des niveaux de fonctionnement normaux, généralement évalués par une note de QI supérieure à environ 70 (± 5 points pour tenir compte des erreurs de mesure).

    D’une manière générale, on s’attend à ce que plus le niveau intellectuel d’un sujet est élevé, plus son niveau d’apprentissage le soit également. Et inversement. Cette liaison doit toutefois être interprétée avec précaution, car les corrélations entre le QI et les performances scolaires sont loin d’être parfaites. Nous avons vu plus haut qu’elles se situent habituellement entre 0,50 et 0,60. Par conséquent, même si la mesure de l’intelligence peut être un critère de diagnostic différentiel important, il ne doit jamais être utilisé de manière stricte, mais au contraire relativisé en fonction des autres informations disponibles.

    1.3. Une source d’information clinique

    Les tests d’intelligence peuvent être considérés comme des réactifs. Ils stimulent l’activité cognitive des sujets et provoquent la mise en œuvre d’une large gamme de processus mentaux et de comportements. Par-delà l’exactitude des réponses aux questions posées, tout ce que le sujet manifeste dans le cadre du testing peut présenter un intérêt clinique. Durant l’examen intellectuel, le sujet donne à voir au clinicien un échantillon de ses comportements et de ses émotions en situation de résolution de problème. L’examen intellectuel offre ainsi, sur une très courte période, un ensemble d’observations qui exigeraient beaucoup de temps et de patience pour être recueillies en situation naturelle.

    Les informations cliniques qui peuvent être rassemblées lors d’un examen intellectuel sont très variées. Elles sont synthétisées dans le tableau 3. Ces informations sont essentielles pour interpréter correctement les résultats du test. Elles peuvent également être utiles pour l’ensemble de l’examen, que ce soit à propos du fonctionnement cognitif ou de la personnalité du sujet, et être le point de départ d’hypothèses qui feront ensuite l’objet d’une évaluation plus approfondie et d’une recherche d’informations complémentaires.

    1La compréhension de la tâche. Le sujet a-t-il conscience de l’objectif du testing et de la nécessité de faire de son mieux ? Comprend-il correctement les consignes ?

    2L’intérêt et la motivation pour la tâche. Quelle est la motivation initiale du sujet ? Comment évolue cette motivation face aux obstacles, suite aux échecs et suite à la répétition d’items similaires ?

    3Humeur générale. Quel est l’état d’humeur du sujet au début de l’examen ? Comment évolue-t-il en cours d’examen ?

    4Les réactions émotionnelles. Le sujet est-il anxieux face au jugement du clinicien ? Redoute-t-il l’échec ? En cas de réussite d’une tâche réagit-il par de la jubilation et de l’arrogance ? En cas d’échec d’une tâche, réagit-il par de la frustration et de la colère ? A-t-il tendance à persévérer ou à abandonner ? Est-il anxieux lorsque le temps est chronométré ?

    5Le contrôle attentionnel. Le sujet est-il capable de soutenir son attention au cours d’une même tâche et au travers des différentes tâches ? Résiste-t-il aux distractions ? Est-il envahi par des pensées parasites ? Ses réponses sont-elles impulsives ou, au contraire, réfléchies et posées ?

    6La mémoire. Le sujet a-t-il tendance à oublier partiellement ou totalement les consignes ? Demande-t-il de répéter les consignes ? Perd-il le fil au cours des tâches plus longues ? Répète-t-il des réponses déjà fournies ?

    7Les stratégies et les styles de performance. Le sujet utilise-t-il préférentiellement une procédure par essais et erreurs ou, au contraire, sa démarche est-elle systématique ? Recherche-t-il la précision de manière exagérée ? Manifeste-t-il des comportements compulsifs ? Ses réponses sont-elles approximatives et traduisent-elles une certaine négligence ?

    8L’autocritique. Le sujet évalue-t-il correctement la qualité de ses réponses ? Se surestime-t-il ? Se sous-évalue-t-il ?

    9La fatigabilité. Le sujet manifeste-t-il une fatigue grandissante au cours du testing ? Ses performances ont-elles tendance à fléchir au cours du temps ?

    10Les réactions motrices. Quelles sont les manifestations faciales du sujet en cours de testing ? Présente-t-il des tics ? Manifeste-t-il de l’instabilité motrice ? Quel est le degré de précision de ses réponses motrices ? Manifeste-t-il des tremblements ? Ses réalisations motrices sont-elles lentes ou rapides ?

    11Le langage. Quelle est la qualité des réponses verbales du sujet (précision du vocabulaire, respect de la syntaxe, complexité des phrases) ? Souffre-t-il de troubles de l’expression orale (bégaiement, défauts de prononciation) ? Formule-t-il des associations verbales spontanées à propos de certains stimuli et de certaines réponses ?

    12L’attitude à l’égard du clinicien. Le sujet recherche-t-il l’approbation du clinicien ? Demande-t-il confirmation de l’exactitude de ses réponses ? Manifeste-t-il une attitude agressive, arrogante ou moqueuse à l’égard du clinicien ? Est-il indifférent au clinicien ? Manifeste-t-il de la méfiance et une attitude interprétative à l’égard de ce dernier et de la tâche proposée ? Fait-il des tentatives pour sortir de la tâche et entamer une discussion ? Réagit-il au stress par l’humour ? Présente-t-il des comportements de séduction ou de manipulation ?

    Tableau 3 – Informations cliniques récoltées durant le testing intellectuel.

    1.4. Une exigence administrative

    Divers règlements administratifs prescrivent de fournir le QI du sujet examiné afin de déterminer le degré de son handicap et les aides auxquelles il a droit. Dans certains cas, compte tenu des contraintes légales, la mesure du QI peut avoir des conséquences incalculables pour l’individu examiné. Un cas extrême est observé aux États-Unis où une personne condamnée à mort ne peut être exécutée si elle est reconnue handicapée mentale. Comme la mesure de l’intelligence joue un rôle clé dans ce diagnostic, le QI obtenu par un individu peut littéralement être une question de vie ou de mort (Lichten & Simon, 2007).Vu ses conséquences pour le sujet, l’évaluation intellectuelle joue ici un rôle crucial. Toutefois, cette évaluation est souvent mal perçue par les praticiens chargés de la réaliser. Une telle perception est généralement fondée. En effet, les règlements relatifs à la mesure de l’intelligence sont souvent inadéquats, car ils ne tiennent pas compte des caractéristiques particulières de cette mesure. Ainsi, la plupart des règlements proposent des valeurs de référence rigides dont les fondements sont rarement explicités et qui ne prennent pas en compte les inévitables erreurs de mesure. Les particularités individuelles, émotionnelles ou comportementales qui peuvent affecter la mesure du QI sont, elles aussi, négligées par les règlements. Les praticiens perçoivent dès lors un décalage entre ce qu’ils évaluent (une réalité complexe) et ce qui leur est demandé (l’énoncé d’un simple chiffre). Ce décalage est souvent vécu avec un sentiment de frustration et d’iniquité à l’égard des personnes testées. Par conséquent, l’usage administratif du QI devrait, au minimum, respecter les trois règles suivantes : (1) le QI devrait toujours être communiqué avec son intervalle de confiance qui rappelle son erreur de mesure (tableau 4) ; (2) le QI devrait toujours être accompagné d’informations à propos de la validité de son recueil (degré de collaboration, fatigabilité, handicaps ou troubles interférant avec les performances…) ; (3) le QI devrait toujours être accompagné d’une interprétation qui intègre cette valeur dans l’ensemble du tableau clinique.

    Qu’est-ce qu’une erreur de mesure ?

    La plupart des tests psychologiques, en particulier les tests d’intelligence, ont été construits dans le cadre de la théorie de la note vraie. Cette théorie postule que la note obtenue à un test est toujours composée d’une note vraie et d’une erreur de mesure. La note vraie correspond à la caractéristique mesurée sans erreur. Elle n’est pas observable directement et peut seulement être estimée à partir de la note obtenue. Les erreurs de mesure découlent des multiples erreurs aléatoires qui, inévitablement, entachent l’évaluation. Elles proviennent du sujet examiné (par exemple, une distraction) et de l’examinateur (voir à ce propos Styck et Walsh, 2016). Parfois les erreurs favorisent le sujet (sa note observée est supérieure à sa note vraie) et parfois le défavorisent (sa note observée est inférieure à sa note vraie). Comme nous ne connaissons pas la note vraie d’un sujet, il est impossible de déterminer le sens et l’ampleur de l’erreur de mesure lors d’un testing particulier. La seule information dont nous disposons à propos de l’erreur de mesure est le coefficient de fidélité qui représente le degré de précision des mesures obtenues à l’aide du test utilisé.

    Pourquoi déterminer un intervalle de confiance ?

    Grâce au coefficient de fidélité, nous pouvons déterminer l’erreur type de mesure du test. Cette valeur est très utile pour construire un intervalle de confiance autour de la note obtenue au test. Cette note n’est qu’une des notes possibles que le sujet pourrait obtenir lors d’une passation quelconque. Les erreurs de mesures aléatoires font en effet varier les notes obtenues dans une zone centrée sur la note vraie du sujet. Connaissant l’erreur type de mesure, il est possible de construire un intervalle de confiance autour de la note obtenue. En fonction de la largeur de cet intervalle, nous aurons une chance plus ou moins importante que la note vraie du sujet s’y trouve. Les constructeurs de tests fournissent généralement cette information dans le manuel pour les différentes notes observées possibles. L’utilisation d’un intervalle de confiance permet aux praticiens de rappeler que la note obtenue est entachée d’erreurs et ainsi de relativiser sa valeur. L’intervalle de confiance permet de rester prudent lorsque des valeurs de référence sont utilisées comme critère diagnostique (par exemple, le QI de 70 utilisé comme valeur diagnostique du handicap mental léger).

    Tableau 4 – Erreur de mesure et intervalle de confiance.

    2. Les tests d’intelligence standardisés

    2.1. Nécessité d’une mesure standardisée de l’intelligence

    Faut-il nécessairement utiliser des tests pour évaluer l’intelligence ? Ne peut-on pas simplement s’appuyer sur les données d’anamnèse et l’observation clinique pour apprécier le degré d’intelligence d’une personne ? Certains praticiens répondent par l’affirmative à cette dernière question et rejettent l’usage des tests jugés inutiles. Ce faisant, ils surestiment souvent la validité et la fiabilité de leur propre jugement clinique et prennent le risque de commettre des erreurs diagnostiques préjudiciables au patient examiné. Les psychologues sociaux ont abondamment montré que les jugements cliniques sont souvent biaisés, influencés par les stéréotypes et les erreurs de raisonnement (voir Garb, 1998, pour une synthèse sur cette question). Dans la quatrième section de ce chapitre, nous analyserons plus en détail certains facteurs qui peuvent affecter nos jugements à propos des capacités cognitives des individus examinés.

    L’usage de tests d’intelligence permet aux praticiens d’éviter certains biais de jugement. En effet, une des caractéristiques essentielles des tests psychologiques est la standardisation de leurs procédures de passation et de cotation. Cette standardisation permet de recueillir des performances comparables d’un individu à l’autre. Malheureusement, les praticiens ne respectent pas toujours les conditions standard d’utilisation des tests et réduisent ainsi la validité des comparaisons interindividuelles. Les variations dans les conditions d’application des tests peuvent concerner l’énoncé des questions (p.ex., reformulation des questions), le matériel (p.ex., non-respect des règles de présentations des stimuli), les limites de temps, les critères de cotation (p.ex., assouplissement ou durcissement des critères). Ces variations peuvent aussi concerner le contexte de passation qui devrait être calme et propice à la concentration sur les tâches proposées. Les tests sont parfois administrés dans des lieux non adéquats, ce qui peut entraîner une invalidation de leurs résultats.

    L’usage de tests standardisés et le respect de leurs procédures offrent des garanties de validité et de fiabilité de l’évaluation clinique de l’intelligence. Ils ne garantissent toutefois pas la pertinence de cette évaluation. Cette question est extérieure aux tests. Elle est du ressort du clinicien qui doit juger si évaluer l’intelligence est opportun dans l’examen en cours.

    2.2. Intelligence et Quotient intellectuel

    Le Quotient intellectuel (QI) est souvent utilisé, à tort, comme synonyme d’intelligence. On oublie alors que l’intelligence ne nous est connue que de manière indirecte et approximative au travers d’un échantillon de performances. Le QI n’est qu’une des expressions possibles de l’intelligence. Il quantifie le degré d’efficience d’un individu dans un ensemble d’épreuves comparativement à l’efficience d’un échantillon d’individus représentatifs de la population de référence.

    La notion de Quotient intellectuel a été proposée en 1912 par le psychologue allemand William Stern. Jusque-là, seul un âge mental était calculé à partir des performances aux tests d’intelligence. L’âge mental correspond au niveau de performance moyen des sujets d’un âge donné. Par exemple, si les enfants de 10 ans réussissent en moyenne les 15 premières questions d’un test d’intelligence, le sujet qui réussira ces questions puis échouera aux suivantes, plus difficiles, sera crédité d’un âge mental de 10 ans. L’inconvénient majeur de l’âge mental est de ne pas permettre des comparaisons aisées entre les performances de sujets d’âges différents. Si, par exemple, un enfant de 10 ans est crédité d’un âge mental de 7 ans et un enfant de 12 ans est crédité d’un âge mental de 9 ans, tous les deux présentent un retard de 3 ans. Mais le retard de ces deux enfants n’est pourtant pas comparable, car il n’est pas observé chez des sujets de même âge. Pour résoudre ce problème de comparaison, Stern propose de diviser l’âge mental du sujet par son âge chronologique, puis de multiplier le résultat par 100 pour éviter les valeurs décimales. Le résultat de ce calcul est un quotient qui a pour principal avantage de relativiser l’âge mental. Le QI correspond en effet au niveau de performance intellectuelle d’un sujet compte tenu de son âge chronologique. Si les performances du sujet correspondent à celles attendues en moyenne chez les enfants du même âge, son QI sera égal à 100. Si elles se situent sous cette moyenne, son QI sera inférieur à 100. Et si elles sont au-dessus, son QI sera supérieur à 100.

    Le QI ainsi calculé est, normalement, stable au cours du développement. En effet, si les performances du sujet évoluent de concert avec celles de son groupe d’âge, sa position au sein de ce groupe restera stable. Par exemple, si les performances d’un enfant sont, au cours des années, toujours identiques aux performances moyennes des enfants de son âge, le QI de cet enfant restera égal à 100. Certes, ses performances se sont améliorées au cours du temps, mais sa position au sein de son groupe de référence est restée stable. Le principe de la stabilité du QI calculé selon la formule de Stern est plus théorique que réel (figure 1). Il suppose en effet une corrélation parfaite entre l’âge mental et l’âge chronologique. Ces deux variables doivent évoluer de manière strictement parallèle (schéma de gauche). Or, ce n’est jamais le cas. Si l’âge chronologique évolue de manière régulière, l’âge mental évolue souvent par étapes (schéma du milieu), ce qui entraîne ipso facto des variations du QI. Un autre problème du QI calculé selon la formule de Stern est son impossible utilisation lorsque l’âge mental ne progresse plus, ou même régresse. C’est ce qui se passe à l’âge adulte et au cours du vieillissement (schéma de droite).

    Figure 1 – Relations entre l’âge mental et l’âge chronologique.

    Depuis les travaux de Yerkes autour des années 20, une autre méthode de calcul du QI a progressivement remplacé celle de Stern. Elle a été popularisée à partir de 1939 par Wechsler dans ses différentes échelles d’intelligence. Cette méthode permet de surmonter les problèmes rencontrés avec la formule de Stern. Yerkes (Yerkes & Wood, 1916) délaisse la référence à l’âge mental et propose de situer le score brut (la somme des points aux items) d’un sujet au sein de la distribution des scores de son groupe d’âge. Généralement, cette distribution est traduite sur une échelle dont la moyenne est 100 et l’écart type 15. C’est le cas des échelles de Wechsler où un sujet dont le score brut correspond à la moyenne de son groupe d’âge est crédité d’un QI de 100. Si le score brut se situe à un écart type au-dessus de cette moyenne, ce sujet sera crédité d’un QI de 115. Du point de vue de Yerkes, l’usage du terme « QI » et la référence à une valeur moyenne égale à 100 sont de pures conventions.

    Quelle que soit la formule du QI utilisée, les tests d’intelligence sont tous des tests normés. Les performances à ces tests n’ont en effet de valeur que par comparaison à celles d’un échantillon représentatif de la population de référence (les normes). Le score du sujet est dès lors relatif aux normes utilisées pour le calculer. Un même score brut peut être considéré comme faible ou élevé en fonction du niveau moyen de la population de référence. Cette relativité peut être observée lorsque l’on compare un même score brut aux performances de groupes d’âges différents. Si le groupe est composé de sujets jeunes, ce score brut correspondra, par exemple, à un QI de 100, alors que si le groupe est composé de sujets âgés, ce même score brut pourra correspondre à un QI de 115. Deux sujets qui ont obtenu le même score brut à un test d’intelligence ne seront donc pas nécessairement crédités du même QI. Inversement, deux sujets qui ont obtenu un même QI ne seront pas nécessairement capables de réaliser les mêmes performances cognitives.

    3. Une évaluation contextualisée

    Trop souvent, la mesure de l’intelligence est perçue par le public, mais aussi par certains professionnels, comme analogue à celle de la taille ou de la température. Lorsqu’un médecin mesure notre taille et prend notre température, sa personnalité et la relation que nous entretenons avec lui ne modifient pas les caractéristiques mesurées. La marque de fabrique du thermomètre et de la toise est également une information sans importance. Dans ce cas, ni le contexte ni l’instrument n’ont d’influence sur la mesure observée. Ce qui est vrai pour la taille et la température ne l’est cependant pas pour l’intelligence. Lorsque nous évaluons l’intelligence, les conditions de l’examen, la relation du patient avec le clinicien et le test utilisé ont une influence sur le résultat obtenu. Il est impossible de mesurer l’intelligence de manière neutre, impersonnelle et universelle. Au contraire, les mesures de l’intelligence sont toujours contextualisées et relatives à l’instrument utilisé.

    Une autre croyance erronée est que, comme la taille de l’adulte, l’intelligence est une caractéristique stable, qui ne se modifie pas au cours du temps. Ce n’est pas le cas. L’intelligence évolue tout au long de la vie. Cette évolution est déterminée par des facteurs internes (vieillissement normal, dégénérescence pathologique, troubles de la personnalité…) et par des facteurs externes (activité professionnelle, opportunités d’apprentissage…). Il est par conséquent inexact de considérer la mesure de l’intelligence comme nécessairement stable sur une très longue période.

    Dans les paragraphes suivants, nous allons examiner plus en détail les différentes sources de relativité des mesures de l’intelligence que nous venons de citer : les instruments, le clinicien et sa relation avec le patient, ainsi que les facteurs internes et externes d’évolution de l’intelligence.

    3.1. Diversité des mesures de l’intelligence

    Tous les tests d’intelligence appliqués à un même sujet ne fourniront pas le même résultat, loin de là. Un test court, uniquement composé d’items demandant de compléter des séries numériques, ne fournira pas les mêmes résultats qu’une batterie composée d’un grand nombre d’épreuves diversifiées. Le score total et les informations cliniques recueillies à l’aide de ces deux tests ne pourront pas être considérés comme équivalents, même si les deux instruments sont corrélés. Les corrélations entre les tests d’intelligence ne sont jamais parfaites et varient entre 0,60 et 0,80. Les conclusions que nous pourrons tirer d’un examen intellectuel seront, par conséquent, toujours relatives au test utilisé. Les références de ce test (nom et date d’édition) devront d’ailleurs être clairement mentionnées dans toutes communications ultérieures des résultats.

    D’où proviennent les différences entre les tests d’intelligence ? Ces différences ont deux sources : les fondements théoriques et les qualités métriques des tests.

    Dans le second chapitre, nous verrons qu’il n’y a pas aujourd’hui d’accord sur la définition de l’intelligence. Par conséquent, les fondements théoriques des tests d’intelligence peuvent varier d’un instrument à l’autre. Depuis la création du premier test d’intelligence par Binet en 1905, plusieurs modèles de l’intelligence se sont succédé. Mais aucun de ces modèles n’a définitivement triomphé. Aujourd’hui, le modèle de l’intelligence globale, proposé par Binet, continue d’occuper une place importante dans le champ d’évaluation clinique au travers des échelles d’intelligence de Wechsler. Mais, au côté de ces échelles, on trouve également des tests basés sur le modèle de l’intelligence de Spearman dominé par le facteur g, comme les Matrices de Raven, et sur le modèle multifactoriel de Thurstone, comme le test Primary Mental Abilities (PMA). Comme les constructeurs de tests ne s’appuient pas tous sur un même modèle de l’intelligence, les tests qu’ils produisent ne mesurent pas nécessairement une même réalité, même si, dans tous les cas, leurs auteurs les qualifient de « test d’intelligence ». Le tableau 5 illustre la proximité ou la distance qui peut exister entre des tests d’intelligence en fonction du modèle sur lequel ils ont été construits. Deux de ces tests sont basés sur le modèle global de l’intelligence (la WAIS-III et le Standford-Binet), alors que le troisième est basé sur le modèle du facteur g (les Matrices de Raven). On peut constater que les corrélations entre la WAIS-III et le Standford-Binet sont très élevées, alors qu’elles sont sensiblement plus faibles entre la WAIS-III (particulièrement le QI Verbal) et les Matrices de Raven.

    Tableau 5 – Corrélations entre trois tests classiques d’intelligence (d’après Wechsler, 1997).

    Il est évident que les différents tests d’intelligence ne sont pas substituables l’un à l’autre. Par conséquent, lorsque les praticiens choisissent d’utiliser un test pour mesurer l’intelligence d’un sujet, ils doivent avoir conscience de la diversité des modèles de l’intelligence auxquels ils peuvent se référer. Cette compréhension des modèles de l’intelligence doit guider le choix des instruments de mesure et l’interprétation des résultats.

    Mais les fondements théoriques des tests d’intelligence ne constituent pas la seule source de différences entre les résultats recueillis à ces tests. Deux tests basés sur le même modèle théorique peuvent produire des résultats différents parce qu’ils ne possèdent pas les mêmes qualités métriques. Les principales caractéristiques métriques, sources de différences entre tests, sont la validité, la fiabilité, la sensibilité et les normes. Nous ne décrirons pas ici en détail ces différentes notions psychométriques présentées de manière plus approfondie dans des ouvrages consacrés aux théories de la mesure (par exemple, dans Laveault & Grégoire, 2014). Rappelons brièvement que la validité d’un test nous informe à propos du

    Vous aimez cet aperçu ?
    Page 1 sur 1