Search Dental Tribune

Les outils d'IA pour l'anesthésiologie dentaire sont prometteurs mais nécessitent encore du travail

À l'heure actuelle, les grands modèles de langage sont limités dans la quantité d'informations qu'ils peuvent fournir avec précision sur l'anesthésiologie dentaire. (Photo : Tada Images/Shutterstock)

YOKOSUKA, Japon : Les grands modèles de langage (LLMs), un type d’outil d’intelligence artificielle (IA), gagnent en popularité dans diverses disciplines médicales, y compris l’anesthésiologie dentaire, en raison de leur potentiel à améliorer la collecte d’informations, les soins aux patients et les pratiques éducatives. Une nouvelle étude menée au Japon a évalué l’utilité des principaux LLMs en anesthésiologie dentaire et a conclu que, bien que des modèles comme ChatGPT 4 et Claude 3 Opus soient prometteurs, des avancées supplémentaires dans la formation des modèles et l’ingénierie des commandes, ainsi que la disponibilité d’informations spécifiques au domaine et de haute qualité, sont essentielles pour leur intégration efficace en anesthésiologie dentaire.

 

Les LLMs sélectionnés par les chercheurs incluaient également Gemini 1.0 et ont été utilisés pour l'examen de certification du conseil de la Société japonaise d'anesthésiologie dentaire. L'objectif était d'évaluer l'utilité de ces modèles en comparant leur précision dans les réponses aux questions de l'examen, afin de fournir des indications sur leur application en anesthésiologie dentaire.

L'étude a utilisé 295 questions à choix multiples tirées de l'examen, couvrant la période de 2020 à 2022, en excluant les questions nécessitant une interprétation visuelle ou jugées inappropriées. Les questions ont été saisies manuellement dans les LLMs sans ingénierie de commande spécialisée. Chaque modèle a répondu aux questions trois fois, et la précision a été déterminée en comparant les réponses aux réponses consensuelles, fournies par des anesthésistes dentaires certifiés. Les performances ont été analysées dans six catégories : physiologie de base, anesthésie locale, sédation et anesthésie générale, gestion systémique, gestion de la douleur, et choc et réanimation.

ChatGPT 4 a obtenu la meilleure précision (51,2 %), suivi de Claude 3 Opus (47,4 %), tandis que Gemini 1.0 était nettement distancé (30,3 %). ChatGPT 4 et Claude 3 Opus ont particulièrement bien performé dans des domaines tels que la gestion systémique et la gestion de la douleur. Cependant, tous les modèles ont affiché des taux de précision globaux inférieurs à 60 %, ce qui suggère des limites dans leur utilité actuelle pour la prise de décision clinique en anesthésiologie dentaire.

L'étude a attribué la précision relativement faible à plusieurs facteurs. Tout d'abord, la disponibilité limitée d’informations sur l'anesthésiologie dentaire en ligne pourrait avoir un impact sur les performances des modèles. De plus, l'absence d'ingénierie spécifique des commandes et les éventuelles ambiguïtés dans les questions originales en japonais ont pu contribuer aux résultats sous-optimaux. Les auteurs ont noté que l'optimisation des commandes pourrait améliorer de manière significative la précision des LLMs dans la réponse aux questions médicales.

Malgré ces limitations, l'étude a mis en évidence le potentiel des LLMs pour soutenir la pratique de l'anesthésiologie dentaire, notamment dans les tâches administratives telles que la documentation. Cependant, elle a également mis en garde contre leur utilisation pour des décisions cliniques complexes, en raison de risques tels que les « hallucinations », où les modèles génèrent des réponses plausibles mais incorrectes.

L’étude intitulée « Evaluating large language models in dental anesthesiology: A comparative analysis of ChatGPT‑4, Claude 3 Opus, and Gemini 1.0 on the Japanese Dental Society of Anesthesiology board certification exam », a été publiée en ligne le 27 septembre 2024 dans Cureus.

 

Sujets:
Mots-clés:
To post a reply please login or register
advertisement