El auge de las aplicaciones de PNL impulsadas por API: ¿Ciclo exagerado o una nueva industria disruptiva?

Los modelos de lenguaje grande (LLM) han recorrido un largo camino en los últimos años. Desde la generación de diálogos fluidos hasta el resumen de textos y la generación de artículos, los modelos de lenguaje han hecho que sea extremadamente fácil para cualquier persona crear un producto impulsado por NLP. Como resultado, han aparecido cientos de aplicaciones todos los días, principalmente basadas en API como OpenAI, Cohere o Stable Diffusion.

Al observar estos desarrollos, uno podría preguntarse: ¿cuál es el potencial disruptivo de tales aplicaciones? ¿Están preparados para ofrecer resultados transformadores a todas las industrias? ¿O su impacto se limitará a ciertos casos de uso limitados?

Además, ¿qué desafíos deben tener en cuenta los desarrolladores y propietarios de negocios para tener un impacto duradero en este espacio?

Los modelos de lenguaje grande (LLM) han experimentado avances significativos en el último año, principalmente debido al desarrollo de técnicas que los alinean mejor con las preferencias humanas. Esto ha dado como resultado una capacidad impresionante para generar texto fluido en una amplia gama de estilos y para diferentes propósitos, con una precisión, detalle y coherencia significativamente mayores de lo que era posible anteriormente.

También te puede interesarCómo las cámaras de IA detectan objetos y reconocen rostros

La capacidad de los LLM para seguir instrucciones y aprender de los ejemplos presentados en su contexto ha hecho posible abordar prácticamente cualquier tarea de PNL con un LLM, eso es, al menos en principio. Todo lo que se necesita es un aviso cuidadosamente construido que sea capaz de extraer la funcionalidad requerida del LLM. Se puede acceder convenientemente al LLM en sí mismo a través de una simple llamada a la API.

El progreso de los LLM, así como su disponibilidad general, ha llevado a una explosión de aplicaciones basadas en LLM dirigidas a diversos casos de uso. Desde la generación de publicaciones de blog hasta la generación de respuestas de correo electrónico, resúmenes de artículos y reuniones, conversaciones de diálogo fluidas o generación de código.

La mayoría de estas aplicaciones se enfocan en un flujo de trabajo de usuario limitado, esencialmente abstracción de ciertas funcionalidades del LLM subyacente. Por lo general, operan cobrando una prima además de las tarifas de API.

Cuando se trata de resolver problemas tangibles por los que los usuarios están dispuestos a pagar, algunas de las debilidades del enfoque API LLM salen a la luz rápidamente. Exploremos algunos de ellos.

También te puede interesarEl futuro de la inteligencia artificial y el aprendizaje automático: tendencias, desarrollos e implicaciones
Imagen generada con Stable Diffusion.

Los LLM son modelos de propósito general capacitados en todo Internet. Para tareas de propósito general que solo requieren sugerencias creativas, esto suele estar bien: por ejemplo, sugerir un título para una publicación de blog.

Muchos problemas del mundo real, sin embargo, requieren niveles significativos o completos de automatización. A menudo, el problema se encuentra dentro de un dominio limitado, como la extracción de información de artículos biomédicos o legales. Por lo tanto, es poco probable que la falta de especialización del LLM coincida completamente con las expectativas del usuario listas para usar en estos dominios limitados, donde los resultados del LLM requerirían una verificación manual adicional para garantizar que cumplan con las expectativas de calidad.

Este problema se puede aliviar hasta cierto punto: por ejemplo, la ingeniería rápida, el aprendizaje en contexto y el ajuste fino del modelo podrían ayudar a mejorar alinear la base LLM con las expectativas del usuario. Sin embargo, esta ciertamente no es una tarea rápida y fácil, ya que requiere un conocimiento profundo del dominio, conjuntos de datos de retroalimentación humana cuidadosamente construidos, así como una comprensión profunda de la tecnología subyacente. Estos son problemas que es poco probable que se resuelvan simplemente llamando a una API, pero requerirían un enfoque más fundamental del problema.

Las aplicaciones basadas en API que no logran los niveles de automatización esperados corren el riesgo de convertirse en una herramienta más con la que es divertido jugar, pero que no se integran en los flujos de trabajo existentes y, por lo tanto, generan ingresos o tienen un impacto duradero.

También te puede interesarCómo usar Vana Portrait para generar autorretratos con IA
Imagen generada con Stable Diffusion.

Las API LLM han acelerado significativamente el proceso de creación de prototipos de IA. Un prototipo que podría haber llevado años desarrollar ahora se puede construir en una semana. Todo lo que se necesita es una interfaz bonita que encapsule el flujo de trabajo del usuario deseado: la API hace el resto del trabajo pesado.

La velocidad y la flexibilidad que brindan las API son ciertamente sorprendentes: estamos viendo tantas aplicaciones creativas de LLM. Sin embargo, en un nivel más fundamental, se vuelve incierto qué soluciones realmente tienen algo que las separa significativamente del LLM de referencia, que es accesible para cualquier persona. En otras palabras, ¿hay algo más fundamental bajo el capó, o los clientes están pagando esencialmente para acceder a un aviso pulido detrás de una interfaz bonita?

Si bien habrá áreas en las que este enfoque funcionará e incluso conducirá a la tracción del usuario, la pregunta es, ¿qué sucederá cuando salgan 5 aplicaciones similares la próxima semana? ¿Es realmente posible construir un negocio sostenible basándose únicamente en dichas API?

En última instancia, es probable que los ganadores que salgan con éxito de la carrera de aplicaciones LLM sean los que logren capturar rápidamente la tracción del usuario, comprendan dónde reside el valor fundamental y aprovechen la tracción para crear soluciones personalizadas que los diferencien de la competencia. .

También te puede interesarProcesamiento por lotes en Apache Flink — PyFlink Parte 2
Imagen generada con Stable Diffusion.

La dependencia de las API LLM también crea una serie de riesgos comerciales. El proveedor de la API podría, en cualquier momento, decidir hacer cambios que podrían causar un impacto comercial significativo. Por ejemplo, podrían decidir cambiar el precio de la API, cambiar la estructura de tarifas, los términos y condiciones, o incluso realizar cambios en el modelo subyacente.

Muchos usuarios también pueden tener preocupaciones con respecto a la regulación y la seguridad de los datos, ya que sus datos se entregan a terceros.

Esto podría ser potencialmente una receta para el desastre. ¿Qué sucede con su aplicación si una API ya no funciona como se esperaba o si hay una interrupción? Como no posee la tecnología, no tiene ninguna opción de copia de seguridad. Podría cambiar a un proveedor de API diferente, pero ¿funcionaría todo exactamente como antes?? Además, ¿cómo puede establecer la confianza con sus usuarios de que los datos se manejan correctamente y se manejarán correctamente en el futuro?

La falta de control y transparencia con las API es sin duda un aspecto a considerar seriamente, especialmente si todo su caso comercial se basa en ellas.

estamos presenciando un revolución tecnológica impulsado por la disponibilidad de potentes herramientas de IA. Todavía estamos en la punta del iceberg en términos de posibles aplicaciones, y hay muchas incógnitas sobre cómo serán los próximos 6 a 12 meses. Una cosa es segura: los LLM llegaron para quedarse y tendrán un impacto significativo en nuestra sociedad en los próximos años.

Las API LLM ciertamente tienen un papel que desempeñar: proporcionan una interfaz para LLM potentes que hacen que sea extremadamente fácil para cualquier persona crear productos de IA o agregar algunas características de IA a un producto existente, todo sin tener que invertir en ninguna infraestructura o desarrollo. A corto plazo, es probable que muchos de estos productos cobren algo de tracción. Sin embargo, los desafíos descritos en este artículo hacen que sea difícil ir más allá de la etapa de prototipo a largo plazo a medida que aumentan las expectativas de los usuarios y aumenta la competencia.

Es probable que las empresas ganadoras en el espacio sean las que: (1) capitalicen las API para una rápida iteración de prototipos, datos y recopilación de comentarios mientras determinan cuál es el verdadero valor dentro de un nicho; (2) Cree tecnología patentada lo más rápido posible: seleccione conjuntos de datos personalizados, desarrolle y entrene tecnología personalizada que convierta el prototipo en una solución robusta que resuelva un problema del mundo real.

¡Gracias por leer! Si te ha gustado este artículo, deberías considerar suscribiéndome a mi Boletín de PNL o Canal de Youtube.
Si está buscando experiencia de vanguardia en el procesamiento del lenguaje natural, debe consultar nuestros servicios en The Global NLP Lab.

[post_relacionado id=»1219″]

Scroll al inicio