5 lecciones de la creación de canalizaciones de datos para más de 100 indicadores clínicos.
El uso de datos incorrectos para el modelado predictivo en el cuidado de la salud puede tener efectos desastrosos.
Dada la escala, la complejidad, la cantidad de partes responsables de la generación, el almacenamiento, el mantenimiento y la extracción de datos de registros de salud electrónicos, junto con las capas de ciberseguridad, la protección de datos y los protocolos de control de acceso, comprender el linaje de datos de (probablemente fragmentado) el conjunto de datos de registros médicos electrónicos que está ingresando en su modelo podría ser más difícil de lo que se supuso inicialmente.
En ausencia de un sistema sólido de verificación de datos o un análisis de errores astuto durante el desarrollo del modelo, la falta de comprensión del linaje de datos podría dar lugar a que se utilicen inadvertidamente datos incorrectos para el modelado.
También te puede interesarCómo mantenerse a la vanguardia y adaptarse en el campo de la ciencia de datos en rápida evoluciónEste artículo trata sobre lo que aprendí al mapear, evaluar y verificar más de 100 indicadores clínicos condicionales complejos, cada indicador con diferentes niveles de interpretabilidad humana, valores faltantes y complejidad. Para comprender la escala y la complejidad de estos indicadores, eche un vistazo a uno de los protocolos clínicos aquí, que finalmente se implementaron en más de 100 indicadores clínicos. Luego se establecieron canalizaciones de datos para convertir estos indicadores en una interfaz de usuario frontal para que un usuario final pueda monitorear todos los procesos clínicos de forma continua como parte de un proceso de auditoría clínica.
Aquí están mis cinco conclusiones principales:
- Los datos de los eventos clínicos pueden no tener una ‘única fuente de verdad’.
La atención clínica es trabajo en equipo; un equipo de profesionales de la salud dedicados trabajan juntos para garantizar que el paciente pueda recuperarse de manera segura. Esto es especialmente pertinente en el caso de pacientes sometidos a cirugía mayor. En cuanto a los datos de la historia clínica electrónica, significa que la documentación de la mismo evento clínico se puede encontrar en la documentación por todo miembros del equipo involucrado en el cuidado de eso paciente.
Esto es similar a asistir a una reunión en la que todos los asistentes están legalmente obligados a documentar los procedimientos de la reunión. Cuando eso sucede, ¿de qué versión de la documentación debe obtener los datos? Diferentes especialidades clínicas son responsables de diferentes aspectos de la atención clínica, pero también usarían y documentarían la información clínica que sería relevante para ellos.
También te puede interesar Blockchain Data Science with Solidity: análisis avanzado, aprendizaje automático y aplicaciones de IA
Trabaje con su parte interesada clínica al principio para determinar qué grupo clínico principal extraer la información para cada indicador clínico. La mayoría de las veces, los datos clínicamente relevantes solo se pueden encontrar en la documentación clínica o deben combinarse con la documentación clínica; resultados de imágenes, resultados de pruebas de laboratorio o datos de medicamentos sin la contexto clínico obtenido de la documentación clínica tiene una utilidad limitada en un proceso de auditoría clínica.
Sin embargo, la documentación de los médicos es diferente de la documentación de las enfermeras y otros profesionales de la salud. Cada grupo clínico puede usar una plantilla de documentación diferente y tener hábitos de documentación diferentes; incluso dentro de un mismo grupo clínico, pueden existir subgrupos o subespecialidades con su propia documentación específica.
Lo que esto significa es que todo puede resultar en diferentes estructuras de datos que requieren sus propios pasos específicos de limpieza y disputa de datos.