Procesamiento de Lenguaje Natural
En desarrollo
Proyecto Nacional

Inteligencia Artificial para Procesamiento de Lenguaje Natural de Texto Clínico en Español para el Análisis de Real-World-Data

Inteligencia Artificial para Procesamiento de Lenguaje Natural de Texto Clínico en Español para el Análisis de Real-World-Data (TEXT2RWD). PID2020-116898RB-I00. Ministerio de Ciencia e Innovación. IPs: J.M. Jerez – F.J. Veredas. 09/2021 – 08/2025.

Desarrollo de técnicas avanzadas de procesamiento de lenguaje natural específicamente diseñadas para texto clínico en español, con el fin de extraer información valiosa de datos del mundo real para mejorar la atención sanitaria y la investigación médica.

Universidad de Málaga
Instituciones
Profesionales sanitarios e investigadores médicos
Beneficiarios
€109.989,00
Financiamiento
2021 - 2025
Duración
Descripción del Proyecto

Este proyecto tiene como objetivo desarrollar técnicas avanzadas de procesamiento de lenguaje natural específicamente diseñadas para texto clínico en español, con el fin de extraer información valiosa de datos del mundo real (Real-World-Data) para mejorar la atención sanitaria y la investigación médica.

El proyecto se centra en el desarrollo de algoritmos y modelos de inteligencia artificial capaces de procesar y analizar grandes volúmenes de texto clínico no estructurado, extrayendo información relevante para la toma de decisiones médicas y la investigación clínica.

Las técnicas desarrolladas permitirán automatizar el análisis de historias clínicas, informes médicos y otros documentos sanitarios, proporcionando herramientas valiosas para profesionales de la salud e investigadores.

Problema Identificado

Dificultad para extraer información estructurada de texto clínico no estructurado en español

Solución Desarrollada

Desarrollo de técnicas de NLP específicas para texto clínico en español utilizando IA

Resultados Clave

Desarrollo de algoritmos de NLP específicos para texto clínico en español

Creación de corpus anotado de texto médico

Implementación de modelos de extracción de entidades médicas

Desarrollo de herramientas de análisis de datos clínicos

Publicaciones científicas en revistas de alto impacto

Cronograma del Proyecto

Fase 1: Análisis y Diseño

Completado

Análisis de requisitos y diseño de la arquitectura del sistema

Marzo 2022

Fase 2: Desarrollo de Algoritmos

Completado

Desarrollo de algoritmos de NLP para texto clínico

Septiembre 2023

Fase 3: Validación y Pruebas

En progreso

Validación de los modelos con datos reales y pruebas de rendimiento

Marzo 2024

Fase 4: Publicación y Transferencia

En progreso

Publicación de resultados y transferencia de tecnología

Agosto 2025

Financiación y Apoyo Institucional

Este proyecto ha sido posible gracias al apoyo del Ministerio de Ciencia e Innovación y la Universidad de Málaga.

Universidad de Málaga

Universidad de Málaga

Ministerio de Ciencia e Innovación

Ministerio de Ciencia e Innovación

Publicaciones Relacionadas

Named entity recognition for de-identifying Spanish electronic health records

Computers in Biology and Medicine2025

2 citas
Equipo de Investigación
Dr. José Manuel Jerez Aragonés

Dr. José Manuel Jerez Aragonés

Responsable

Inteligencia Computacional en Biomedicina

Dr. Iván Marcelino Gómez Gallego

Dr. Iván Marcelino Gómez Gallego

Investigador

Dr. Gonzalo Joya Caparrós

Dr. Gonzalo Joya Caparrós

Investigador

Dr. Alejandro Luque Suárez

Dr. Alejandro Luque Suárez

Investigador

Dr. Joaquín Páez Moguer

Dr. Joaquín Páez Moguer

Investigador

Dra. Consolación Pineda Galán

Dra. Consolación Pineda Galán

Investigadora

Dr. Juan Salvador Victoria Mas

Dr. Juan Salvador Victoria Mas

Investigador

Instituciones Colaboradoras
Departamento de Lenguajes y Ciencias de la Computación - UMA
E.T.S. de Ingeniería Informática - UMA
Financiamiento
Monto Total
€109.989,00
Fuentes de Financiamiento
MINISTERIO DE CIENCIA E INNOVACION
Proyecto PID2020-116898RB-I00
Tecnologías Utilizadas
Python
spaCy
NLTK
Transformers
BERT
Machine Learning
Deep Learning
Natural Language Processing
Acciones