Preguntas de toxicología en los exámenes MIR: Aciertos en las respuestas de las inteligencias artificiales en comparación con un grupo de expertos en toxicología clínica
Resumen
Objetivo: Valorar la capacidad de varios sistemas de inteligencia artificial para acertar la respuesta correcta a preguntas de toxicología que se han formulado en las convocatorias del Ministerio de Sanidad para obtener plaza de médico-interno-residente (MIR), y compararla con los aciertos que a las mismas preguntas ha ofrecido un grupo de toxicólogos clínicos.
Material y métodos: Se han revisado los cuestionarios para estos exámenes de las cinco últimas convocatorias (2019-2023) y se han seleccionado preguntas de toxicología. Estas preguntas se han pasado a siete chatbots de inteligencia artificial (ChatGPT, Gemini, Copilot, Luzia, Claude, Deepseek y Le Chat), solicitando las respuestas correctas. Las mismas preguntas se formularon también a un grupo de toxicólogos. Se ha valorado el número de respuestas acertadas por cada uno de los participantes.
Resultados: Se han incluido 44 preguntas. El tiempo cronometrado para completar este examen por parte de las inteligencias artificiales fue de 1,01 [0,82-1,52] minutos, mientras que el tiempo estimado que precisaron los toxicólogos fue de 42,00 [28,50-53,50] minutos (p<0,001). Las inteligencias artificiales acertaron una mediana de 41 [39-42] respuestas, mientras que la mediana de respuestas acertadas por el grupo de toxicólogos fue de 32 [26-36] (p<0,001). En el grupo de toxicólogos no se encontraron diferencias en los aciertos en función de su edad, sexo o especialidad médica. Tampoco se han encontrado diferencias en los aciertos entre preguntas teóricas y casos clínicos.
Conclusiones: Los chatbots de inteligencia artificial contestan las preguntas de toxicología de los exámenes MIR más rápidamente y obtienen mejores resultados que un grupo de toxicólogos.
Palabras Clave
Toxicología clínica. Médico Residente. Examen MIR. Examen de toxicología. Inteligencia artificial.