Desidentificación sin esfuerzo: cómo Spark NLP para el cuidado de la salud permite ejecutar la ofuscación y…

La desidentificación es un procedimiento crítico para salvaguardar la información de salud protegida (PHI) dentro de las notas clínicas, donde los datos se anonimizan u ofuscan mediante el reemplazo de entidades reales por otras falsas.

[******][*******][********][*************]

Desidentificación multimodo con Spark NLP para atención médica

¿Por qué necesitamos la aplicación de múltiples políticas de desidentificación a la vez?

Implementación de la funcionalidad multimodo en la desidentificación

import json

sample_json= {
"obfuscate": ["PHONE"] ,
"mask_entity_labels": ["ID"],
"skip": ["DATE"],
"mask_same_length_chars":["NAME"],
"mask_fixed_length_chars":["zip", "location"]
}

with open('multi_mode.json', 'w', encoding='utf-8') as f:
json.dump(sample_json, f, ensure_ascii=False, indent=4)

...
deid = DeIdentification()
.setInputCols(["sentence", "token", "ner_chunk"])
.setOutputCol("deidentified")
.setMode("obfuscate")
.setSelectiveObfuscationModesPath("sample_deid.json")
.setFixedMaskLength(4)

text = '''
Record date : 2093-01-13 , David Hale , M.D .
Name : Hendrickson Ora MR # 7194334
PCP : Oliveira , 25 years-old Record date : 2079-11-09
Cocke County Baptist Hospital , 0295 Keats Street , Phone 55-555-5555
'''

+---------------------------------------------------------------------+------------------------------------------------------+
|sentence |deidentified |
+---------------------------------------------------------------------+------------------------------------------------------+
|Record date : 2093-01-13 , David Hale , M.D . |Record date : 2093-01-13 , [********] , M.D . |
|Name : Hendrickson Ora MR # 7194334 |Name : [*************] MR # <ID> |
|PCP : Oliveira , 25 years-old Record date : 2079-11-09 |PCP : [******] , 22 years-old Record date : 2079-11-09|
|Cocke County Baptist Hospital , 0295 Keats Street , Phone 55-555-5555|**** , **** , Phone 97-182-9152 |
+---------------------------------------------------------------------+------------------------------------------------------+

Conclusión

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio