Análisis de texto con ChatGPT

A) Extracción de conocimiento (NER) 💡

El reconocimiento de entidad nombrada (NER) se refiere a la tarea de identificar automáticamente los términos en diferentes fragmentos de datos textuales, se utiliza principalmente para extraer categorías de entidades importantes, como nombres de medicamentos de notas clínicas, términos relacionados con incidentes de reclamos de seguros y otros dominios. -términos específicos de los registros.

Para realizar NER en ChatGPT, simplemente escriba el mensaje a continuación:

Realice NER médica para el siguiente texto:
Notas: Antecedentes de TVP, comenzó warfarina el 6/6/2020 con 3 mg OD.
Salida del resultado por un archivo json con clase de enfermedad, medicamento, dosis, fecha

La salida de NER por ChatGPT. Imagen por Autores

Tenga en cuenta que la tarea anterior es específica del dominio médico; en el pasado, requería que anotáramos y entrenáramos más de 10 000 filas de datos para que un solo modelo conociera la clase y el término específicos en el texto. ChatGPT puede identificar el término correctamente sin ningún texto preentrenado o ajuste fino, ¡lo cual es un resultado relativamente bueno!

También te puede interesar Visualización de entidades con nombre con Spark NLP

B) Clasificación de texto 💡

Las clasificaciones de texto se refieren al proceso automático para encontrar y clasificar texto en categorías a partir de datos masivos, juega un papel esencial en la recuperación y minería de datos de texto. Ejemplos de aplicaciones de clasificación de texto incluyen alertas clínicas o categorización de factores de riesgo, clasificación de diagnóstico automático y detección de correo electrónico no deseado.

Para realizar la clasificación de texto en ChatGPT, simplemente escriba el mensaje a continuación:

Para las siguientes oraciones, haga una salida json que clasifique el texto en clases: «urgente», «spam», «no urgente», «trabajo»:
— “URGENTE: responda este correo electrónico lo antes posible”.
– «¡Felicidades! ¡Has ganado unas vacaciones gratis!”
— “Recordatorio: su cita con el dentista es la próxima semana”.
Dame una respuesta solo en JSON y envuelve el objeto json con datos

La salida de Clasificación de texto por ChatGPT. Imagen por autor

C) Análisis de sentimiento 💡

El análisis de sentimientos implica determinar el sentimiento o la emoción expresada en un texto. Su objetivo es clasificar el texto en categorías predefinidas, como positivo, negativo o neutral, según el sentimiento subyacente transmitido por el autor. Las aplicaciones del análisis de sentimientos incluyen el análisis de opiniones y comentarios de los clientes, el seguimiento del sentimiento de las redes sociales, el seguimiento de las tendencias del mercado y la medición del sentimiento político durante las campañas electorales.

También te puede interesar Haga que sus modelos de aprendizaje automático sean más pequeños, más rápidos y que consuman menos datos (al mismo tiempo que los mantiene precisos)

Para realizar un análisis de sentimiento en ChatGPT, simplemente escriba el mensaje a continuación:

texto: «¡No me gusta este producto!»
Muestra el sentimiento del texto en formato json

El resultado del análisis de sentimiento de ChatGPT. Imagen por autor

D) Resumen 💡

Los resúmenes automáticos se refieren al proceso mediante el cual los temas principales de uno o más documentos se identifican y presentan de manera concisa y precisa. Esto permite al usuario echar un vistazo a grandes cantidades de datos en poco tiempo. Los ejemplos de aplicaciones incluyen un sistema de resumen que permite la generación automática de resúmenes a partir de artículos de noticias y el resumen de información extrayendo oraciones de los resúmenes de trabajos de investigación.

Para realizar el resumen de reseñas de productos en ChatGPT, simplemente escriba el mensaje a continuación:

También te puede interesar Las mejores API de detección de idioma en 2023

Resuma estas oraciones y genere el resumen final en formato json:


……

La salida de Resumen por ChatGPT. Imagen por autor

ChatGPT es una excelente herramienta de resumen, especialmente para artículos extensos y reseñas complicadas. Al pegar las reseñas en ChatGPT, podemos conocer fácilmente el resumen de las reseñas de productos de un vistazo.

Limitación de LLM

Dado que el propósito de este artículo es explorar la capacidad de los LLM para realizar tareas de análisis de texto, también es esencial reconocer sus limitaciones. Algunas de las limitaciones clave de los LLM incluyen:

  1. uso de recursos: El uso de LLM requiere importantes recursos computacionales y financieros, lo que puede ser un desafío para organizaciones más pequeñas o investigadores individuales con recursos limitados. Hasta la fecha, ChatGPT solo acepta aproximadamente 8,000 tokens para la entrada y salida, para analizar una gran cantidad de datos, requiere que el usuario divida el texto en múltiples fragmentos de datos y puede requerir más llamadas API para las tareas.
  2. Sensibilidad a las frases rápidas: El desempeño de los LLM puede verse influenciado por la forma en que se formulan las indicaciones. Un ligero cambio en la redacción del mensaje puede generar resultados diferentes, lo que podría ser una preocupación cuando se buscan resultados consistentes y confiables.
  3. Falta de experiencia en dominios específicos: Aunque los LLM tienen una comprensión general de varios dominios, es posible que no tengan el mismo nivel de experiencia que los modelos especializados capacitados en datos de dominios específicos. Como resultado, su rendimiento puede ser subóptimo en ciertos casos y requerir un ajuste o conocimiento externo, particularmente cuando se trata de información técnica o altamente especializada.

Palabras de los autores

El advenimiento de LLM como ChatGPT sin duda ha revolucionado el campo del análisis de texto al ofrecer un modelo único capaz de realizar múltiples tareas de PNL con facilidad. Sin embargo, es crucial reconocer sus limitaciones y emplearlas juiciosamente junto con las técnicas tradicionales de PNL, según los requisitos específicos y la experiencia en el dominio necesaria para una tarea determinada.

También te puede interesar Una introducción simple al producto punto

Al comprender las capacidades y limitaciones de los LLM, las empresas, los investigadores y las organizaciones pueden aprovechar su potencial de manera efectiva y eficiente, tomando decisiones informadas basadas en información basada en datos y, en última instancia, desbloqueando el verdadero poder del análisis de texto.

Por último, gracias por leer mis artículos. Si desea suscribirse a la membresía de Medium, considere usar mi enlace a continuación. Me proporcionará un gran apoyo para escribir más artículos.

Si te gusta mi artículo, aquí hay más artículos míos:

Referencias:

  1. https://www.pinecone.io/learn/langchain-prompt-templates/
  2. https://monkeylearn.com/blog/natural-language-processing-techniques/

Scroll al inicio