Comprendre le principe du phenomapping par intelligence artificielle appliquée aux données d’échocardiographie

Mis à jour le mercredi 6 avril 2022
dans
Dr Théo Pezel

Dr Théo Pezel
Service de cardiologie
CHU Lariboisière, AP-HP,
Unité INSERM-UMR 942
Paris

 

Au-delà de nous permettre d’interpréter les données techniques d’imagerie cardiovasculaire, l’Intelligence Artificielle (IA) est aussi utile pour l’analyse statistique de grandes bases de données comportant plusieurs milliers de patients avec des dizaines de paramètres mesurés : la fameuse « gestion des big data ».

Le phenomapping (ou clustering) est incontestablement l’entité la plus fréquemment rencontrée avec ce type d’outil.

Ainsi, dans cet article, nous présenterons de façon simple les grands principes du clustering dans le but de nous permettre d’analyser les résultats d’une étude utilisant ce type de méthode à partir de données d’échocardiographie.

Principe du « phenomapping »

Le phenomapping est une méthode d'analyse statistique utilisée pour organiser des données brutes sous la forme de groupes les plus homogènes possibles : « les phénogroupes ou clusters ».

À l'intérieur de chaque phénogroupe, les données sont regroupées selon certaines caractéristiques communes identifiées par un outil d’IA. En français, on emploie couramment le terme de « regroupement de données ».

Cet outil correspond à un algorithme qui mesure la distance entre chaque patient dans un espace construit à partir de certaines variables prédéfinies (âge, sexe, présence d’un diabète, d’un antécédent d’infarctus du myocarde…). Une fois que cet outil a mesuré cette « distance » entre les patients, il tente de les classer au mieux afin de créer autant de phénogroupes qu’il lui semble nécessaire tout en minimisant au maximum cette distance.

Au final, on obtient une figure permettant de visualiser l’appartenance de chaque patient à un cluster tout en appréciant à quel point le clustering est performant avec des clusters séparés les uns des autres (Figure 1).

Figure 1 : Exemple de représentation dans l’espace de chaque patient en fonction d’un ensemble de données prédéfinies mesurées en échocardiographie (d’après Ernande et al., JACC 2017).

Chaque patient est représenté par un rond vert s’il appartient au phénogroupe 1 (vert), par un triangle bleu s’il appartient au phénogroupe 2 (bleu), ou par un carré rouge s’il appartient au phénogroupe 3 (rouge).

Chaque variable mesurée en échocardiographie est représentée par une vignette portée par un vecteur permettant d’évaluer à quel point une variable participe à la constitution de chaque phénogroupe.

Ainsi, on peut par exemple dire que la valeur du « ratio E/e’ », tout à droite de la figure, est une variable majeure pour définir le phénogroupe 2 (bleu) situé du même côté.

Comment apprécier la qualité d’un phenomapping lorsque l’on lit l’article ?

L’enjeu d’un phenomapping est de proposer une classification suffisamment performante afin de distinguer, de façon claire, les différents groupes en fonction des variables mesurées.

Ainsi, le premier outil permettant d’évaluer facilement cette distinction entre les clusters et les potentielles zones de chevauchements (overlaps) est le « radar-chart » (Figure 2).

Figure 2 : Exemple de Radar-chart présentant la répartition de 3 phénogroupes selon les variables cliniques mesurées dans l’étude (d’après Ernande et al., JACC 2017).

On note ici qu’il existe par exemple un chevauchement complet de l’hypertension entre les phénogroupes 1 et 3, alors que le phénogroupe 2 présente le taux de patients avec hypertension le plus élevé.

Finalement, dans quel type d’étude un phenomapping peut-il être utile ?

La méthode statistique utilisant une analyse non-supervisée pour réaliser du clustering doit être appliquée sur une population hétérogène que l’on a du mal à définir.

Par exemple, Shah et al. ont été les premiers à utiliser ce type d’outil pour caractériser l’insuffisance cardiaque à FEVG préservée. C’est un magnifique exemple d’utilisation du clustering car l’insuffisance cardiaque à FEVG préservée correspond bien à un ensemble de patients hétérogène difficile à stratifier et encore partiellement mal défini.

Une fois que la population à caractériser est bien définie, il est important d’évaluer le maximum de variables possibles permettant de caractériser ces patients. De plus, il est recommandé d’étudier des catégories de variables les plus différentes possibles : variables cliniques, biologiques, génétiques, sociologiques, d’ECG ou de Holter, d’échocardiographie…

L’importance d’évaluer la valeur pronostique du phenomapping

Lorsque l’on réalise un clustering comme décrit précédemment, on peut parfaitement s’arrêter à une étape purement descriptive, qui correspondrait au fait de décrire une population très hétérogène sous la forme de clusters, avec une signification clinique éventuelle. On parle d’études « à visée exploratoire ».

Cependant, le plus souvent, les auteurs vont plus loin, en recherchant des différences de pronostic entre les clusters ! En effet, dans ce cas, les clusters présentent des valeurs pronostiques distinctes, ce qui aide les cliniciens à mieux stratifier le risque d’évènements cardiovasculaires dans cette population initialement hétérogène et mal définie. Dans cette situation, on utilise presque toujours une courbe de survie de Kaplan-Meier permettant de comparer les courbes entre chaque cluster (Figure 3).

Enfin, une meilleure stratification du risque permet d’identifier les patients les plus à risque, et donc de guider la prise en charge diagnostique et thérapeutique.

Figure 3 : Courbe de survie de Kaplan-Meier classique évaluant la survenue d’hospitalisations pour cause cardiovasculaire ou décès dans chaque phénogroupe.

Cette figure permet de comparer la valeur pronostique de chaque phénogroupe à l’aide d’un log-rank test.

Conclusion

Le phenomapping est un outil d’IA très puissant pour nous permettre de mieux comprendre des populations hétérogènes que l’on a du mal à définir, comme par exemple les insuffisants cardiaques à FEVG préservée, les patients avec une hypertension pulmonaire ou une cardiomyopathie dilatée.

Son intérêt majeur réside dans le fait de nous permettre de voir des « réalités cliniques associatives » que l’esprit humain seul n’arrive pas à synthétiser.

En effet, le développement des techniques est tel à notre époque que le nombre de données obtenues pour chaque patient nécessite l’utilisation de ces analyses non-supervisées pour être associées puis percées à jour.

Enfin, l’objectif final de ces travaux est de mieux stratifier le risque de ces populations hétérogènes afin de proposer ensuite des études thérapeutiques randomisées de qualité.

Références bibliographiques

  • Ernande L, et al. Clinical Implications of Echocardiographic Phenotypes of Patients With Diabetes Mellitus. Journal of the American College of Cardiology. 2017. https://doi.org/10.1016/j.jacc.2017.07.792
  • Job A.J. Verdonschot et al. Phenotypic clustering of dilated cardiomyopathy patients highlights important pathophysiological differences. European Heart Journal, 2020. doi:10.1093/eurheartj/ehaa841
  • Shah SJ, et al. Phenomapping for Novel Classification of Heart Failure With Preserved Ejection Fraction. Circulation 2015. DOI: 10.1161/CIRCULATIONAHA.114.010637.

 

 

Retrouvez l'intégralité du dossier spécial "Intelligence artificielle et échocardiographie"

 

Ce contenu vous est proposé avec le soutien institutionnel de GE HEALTHCARE