Dans le cadre de notre partenariat avec l’Université de Princeton, nous avons récemment présenté une étude scientifique co-construite en partenariat avec cette prestigieuse institution et avec la participation de Datafab by Alteca. Présentée lors de la conférence internationale CS2 en Italie par Giuseppe M. Ferro, chercheur à Princeton, cette étude se concentre sur les discours relatifs au changement climatique sur les réseaux sociaux.
Une étude du discours sur le changement climatique
Les réseaux sociaux sont des espaces où les discours climatosceptiques prolifèrent. Ces discussions contestent la fiabilité des modèles climatiques et attribuent rarement le réchauffement climatique aux activités humaines. Le média Reddit a constitué le terrain principal de notre étude.
L’objectif de nos chercheurs était d’analyser et de classer automatiquement les contenus étudiés afin d’évaluer quelles revendications étaient les plus populaires. L’enjeu était également de mesurer l’impact de différents paramètres (précision ou imprécision, lisibilité, etc.) sur leur popularité.
Méthodologie de l’étude
- Collecte des données
Un large volume de posts textuels et d’images a été récupéré depuis la plateforme Reddit, avec différents points de vue sur le réchauffement climatique.
- Traitement des données
À l’aide d’outils d’IA tels que Gemini 1.5 Pro, nous avons obtenu des descriptions textuelles très précises à partir d’images.
Les posts ont été également classés selon leur position et segmentés par typologies de revendications.
- Étude des émotions et paramètres textuels
Les algorithmes ont détecté des émotions associées à chaque post : peur, dégoût, colère, joie, tristesse ou neutralité, mais également différents paramètres tels que la lisibilité, la précision, l’imprécision ou encore l’engagement.
- Analyse approfondie des contenus
L’analyse s’est portée sur différents facteurs :
- La popularité des posts (basée sur le « score » de Reddit couplée au nombre de commentaires) pour les posts textuels d’une part et imagés d’autre part.
- Les émotions transmises dans le discours pour chaque thème.
- L’impact de la précision et des conditions textuelles sur l’engagement des posts.
Principaux résultats de l’étude
- Les revendications les plus populaires concernent l’attribution des causes du réchauffement climatique et la remise en question de la fiabilité scientifique concernant ce phénomène.
- Il existe une forte corrélation entre l’impact des revendications et les émotions négatives, mais aucune avec l’imprécision des contenus.
- Les contenus les plus populaires postés à ce sujet ne sont ni trop vagues, ni trop précis. Et les posts les plus longs sont les contenus les moins vagues.

« Comment pouvons nous lutter contre la désinformation sur le changement climatique ? En analysant les récits. Dans cette étude, nous avons exploré comment les cadres de déni se développent en ligne. L’analyse a été réalisée en utilisant des outils avancés d’intelligence artificielle, à la fois classique et générative, dans le but de fournir une base pour des stratégies basées sur les données qui favorisent une information plus précise et responsable. »
Martino Lovisetto, Responsable du pôle R&D et Innovation
Le rôle de Datafab by Alteca dans ce projet

Datafab est une marque du groupe Alteca spécialisée en ingénierie des données, réunissant une équipe d’experts dédiés à la conception et à la mise en production de solutions data à grande échelle.
Datafab by Alteca a joué un rôle dans le développement des outils nécessaires à cette étude. Harold Takoutsing, expert en data engineering, s’est chargé de la structuration des données multimodales, optimisant leur traitement.
Son expertise a permis de :
- Nettoyer et prétraiter les données.
- Catégoriser les différentes modalités (image, texte, vidéo YouTube, etc.). Cette tâche est très complexe en raison de la forte hétérogénéité des données tout en étant essentielle pour l’analyse qui a été faite ensuite.
Nous remercions Harold pour sa contribution à cette étude dans le cadre de notre programme Open R&D.
Conclusion
Cette approche multimodale a permis de mieux comprendre la manière dont les discours climatiques évoluent dans les espaces numériques et leur capacité à influencer l’opinion publique.