Tutorial de Cohere: cómo usar el nuevo modelo multilingüe de Coheres para responder preguntas sobre su negocio de manera más eficiente

Tutorial de Cohere: cómo usar el nuevo modelo multilingüe de Coheres para responder preguntas sobre su negocio de manera más eficiente

Si tienes un negocio, recibirás muchas preguntas de tus clientes. Además, personas de diferentes países harán preguntas en su idioma nativo. Esto conduce a preguntas duplicadas y mucho trabajo para su atención al cliente. ¿No sería increíble si primero pudiera agrupar estas preguntas y luego responderlas con una sola respuesta? La IA generativa puede hacerlo por usted y eso es exactamente lo que hace el nuevo modelo multilingüe de Coheres. En este tutorial, le mostraremos cómo usar incrustaciones para responder preguntas sobre su negocio de manera más eficiente.

Como ejemplo para este tutorial, imaginamos que somos dueños de un hotel y queremos responder las preguntas de nuestros clientes. Las preguntas vienen en todos los idiomas diferentes y queremos responderlas con una sola respuesta en inglés. Usaremos el nuevo modelo multilingüe de Coheres para agrupar las preguntas y ver cuáles son similares. El nuevo modelo de Cohere es el primer modelo de comprensión de texto multilingüe de la industria que admite más de 100 idiomas y ofrece un rendimiento 3 veces mejor que los modelos de código abierto existentes.

Este es solo un caso de uso del nuevo modelo multilingüe de Coheres. Por ejemplo, podría usarlo para estos tres casos de uso (y más, por supuesto):

  • Búsqueda semántica multilingüe: Para mejorar la calidad de los resultados de búsqueda, el modelo multilingüe de Cohere puede producir resultados rápidos y precisos independientemente del idioma utilizado en la consulta de búsqueda o el contenido de origen.
  • Comentarios de clientes agregados: El modelo multilingüe de Cohere se puede implementar para organizar los comentarios de los clientes en cientos de idiomas, lo que simplifica un desafío importante para las operaciones internacionales.
  • Moderación de contenido multilingüe Zero-Shot: Identificar contenido dañino en comunidades globales en línea es un desafío. Al entrenar el modelo multilingüe de Cohere con algunos ejemplos en inglés, puede detectar contenido dañino en más de 100 idiomas.
  • Antes de comenzar con nuestro ejemplo de hotel, echemos un vistazo rápido a cómo funciona el nuevo modelo multilingüe de Coheres. El modelo de comprensión de texto multilingüe de Cohere utiliza una técnica llamada mapeo de espacio vectorial semántico para colocar textos con significados similares muy cerca, lo que permite una variedad de casos de uso valiosos para entornos multilingües. Por ejemplo, se puede asignar una consulta a este espacio vectorial durante una búsqueda para ubicar documentos relevantes cercanos, lo que a menudo produce mejores resultados de búsqueda que la búsqueda por palabras clave. Sin embargo, para entrenar estos modelos, se necesitan grandes cantidades de datos de entrenamiento, y estos datos históricamente han estado disponibles principalmente en inglés. El trabajo anterior ha intentado usar la traducción automática para mapear estos datos a otros idiomas, pero este enfoque no captura los matices detrás del uso del idioma en diferentes países. Por el contrario, este nuevo modelo está entrenado en un conjunto de datos de casi 1400 millones de pares de preguntas/respuestas en cientos de idiomas, que son preguntas reales formuladas por hablantes de esos idiomas, lo que permite capturar matices específicos del idioma y del país. ¿Quieres aprender aún más? Consulte el artículo de Cohere.

    Empecemos. Para nuestro ejemplo de preguntas sobre hoteles, utilizaremos las siguientes preguntas:

    Puedes ver que las preguntas están en diferentes idiomas. Inglés, alemán, francés y chino. Tras una inspección más cercana, puede ver que algunas de las preguntas son muy similares. En general, se pueden identificar 5 grupos de temas:

  • Comida
  • Piscina
  • Estación de carga
  • Teatro
  • Desayuno
  • Automaticemos este proceso de agrupamiento con el nuevo modelo multilingüe de Coheres. Recomendamos usar el patio de recreo para probar el modelo y tener una idea de él. Puedes encontrar el parque infantil aquí.

    Agreguemos nuestras preguntas al campo ‘Textos’ así:

    En el lado derecho puede establecer parámetros. Cambie el modelo a ‘multilingüe-22-12’ y trunque a ‘Ninguno’. Luego haga clic en ‘Calcular’. Verá que el modelo ha agrupado las preguntas en 5 grupos.

    Ahora puede ver que el modelo ha agrupado las preguntas en 5 grupos. Los puntos que están cerca uno del otro son similares. Ahora puedes contestar las preguntas con una sola respuesta.

    Pero pasemos de Coheres Playground a nuestro propio código. Puede exportar este ejemplo actual con el botón ‘Exportar código’. Elija el lenguaje de programación que desea utilizar. Usaremos Python.

    Desde aquí puede continuar usando las incrustaciones para su propio caso de uso.

    ¡Únase a nuestros Hackathons de IA para probar su conocimiento y construir con la ayuda de nuestros mentores herramientas basadas en IA para cambiar el mundo! Consulte los próximos en el enlace https://lablab.ai/event

    ¡Gracias! Si disfrutó de este tutorial, puede encontrar más y continuar leyendo en nuestra página de tutoriales: Fabian Stehle, pasante de ciencia de datos en New Native

    Deja un comentario

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Scroll al inicio