anonimizacioninformesmedicos's Introduction

Anonimización de Informes Médicos

Proyecto dedicado a la anonimización de los informes médicos obtenidos de la tarea MEDDOCAN (en español).

El proyecto se compone de:

Memoria del trabajo (MemoriaTFM.pdf). Se explica todo el proceso realizado para llevar a cabo la anonimización de informes médicos.
CódigoTFM. Se encuentra el código realizado para el proyecto y los documentos utilizados. Se ha realizado en Python 3.7. Se apoya principalmente en la librería de spaCy para PLN que usa el corpus AnCora y WikiNER como entrenamiento para textos en español, y la librería CRFsuite para entrenamiento de un modelo de Conditional Random Field.

Resumen

El presente trabajo propone un modelo supervisado que usa los CRFs (Conditional Random Fields) junto con indicaciones específicas, expresiones regulares y diccionarios para la identificación de información de salud protegida (Protected Health Information o PHI) en los informes de la tarea de desafío de MEDDOCAN. Finalmente, el sistema de este trabajo ha obtenido un F1-score de 0.94, frente al 0.97491 de Bosch Center for Artificial Intelligence (Germany) ganador de esta tarea. Por tanto, podríamos considerar que la propuesta no ha estado mal encaminada.

Recommend Projects

miguelramosfdz / anonimizacioninformesmedicos Goto Github PK

anonimizacioninformesmedicos's Introduction

Anonimización de Informes Médicos

Resumen

anonimizacioninformesmedicos's People

Contributors

Watchers

Recommend Projects

React

Vue.js

Typescript

TensorFlow

Django

Laravel

D3

Recommend Topics

javascript

web

server

Machine learning

Visualization

Game

Recommend Org

Facebook

Microsoft

Google

Alibaba

D3

Tencent

Jobs