Desidentificación sin esfuerzo: cómo Spark NLP para el cuidado de la salud permite ejecutar la ofuscación y…

La desidentificación es un procedimiento crítico para salvaguardar la información de salud protegida (PHI) dentro de las notas clínicas, donde los datos se anonimizan u ofuscan mediante el reemplazo de entidades reales por otras falsas.

[******][*******][********][*************]

Desidentificación multimodo con Spark NLP para atención médica

¿Por qué necesitamos la aplicación de múltiples políticas de desidentificación a la vez?

También te puede interesarUso de variedades hessianas para el aprendizaje automático, parte 1

Implementación de la funcionalidad multimodo en la desidentificación

También te puede interesarQué esperar al crear imágenes de IA con DALL-E: los pros y los contras
import json

sample_json= {
"obfuscate": ["PHONE"] ,
"mask_entity_labels": ["ID"],
"skip": ["DATE"],
"mask_same_length_chars":["NAME"],
"mask_fixed_length_chars":["zip", "location"]
}

with open('multi_mode.json', 'w', encoding='utf-8') as f:
json.dump(sample_json, f, ensure_ascii=False, indent=4)

También te puede interesar[NLP Note]incrustación
...
deid = DeIdentification()
.setInputCols(["sentence", "token", "ner_chunk"])
.setOutputCol("deidentified")
.setMode("obfuscate")
.setSelectiveObfuscationModesPath("sample_deid.json")
.setFixedMaskLength(4)

text = '''
Record date : 2093-01-13 , David Hale , M.D .
Name : Hendrickson Ora MR # 7194334
PCP : Oliveira , 25 years-old Record date : 2079-11-09
Cocke County Baptist Hospital , 0295 Keats Street , Phone 55-555-5555
'''

También te puede interesarImplementar BLIP2 en HuggingFace
+---------------------------------------------------------------------+------------------------------------------------------+
|sentence |deidentified |
+---------------------------------------------------------------------+------------------------------------------------------+
|Record date : 2093-01-13 , David Hale , M.D . |Record date : 2093-01-13 , [********] , M.D . |
|Name : Hendrickson Ora MR # 7194334 |Name : [*************] MR # <ID> |
|PCP : Oliveira , 25 years-old Record date : 2079-11-09 |PCP : [******] , 22 years-old Record date : 2079-11-09|
|Cocke County Baptist Hospital , 0295 Keats Street , Phone 55-555-5555|**** , **** , Phone 97-182-9152 |
+---------------------------------------------------------------------+------------------------------------------------------+

Conclusión

Scroll al inicio