Tutorial de OpenAI Whisper: Actualización de nuestra API de Whisper con GPT-3

Tutorial de OpenAI Whisper: Actualización de nuestra API de Whisper con GPT-3

¿Qué es Susurro?

Whisper es un sistema automático de reconocimiento de voz de última generación de OpenAI que ha sido entrenado en 680 000 horas de datos supervisados ​​multilingües y multitarea recopilados de la web. Este conjunto de datos grande y diverso conduce a una mayor solidez de los acentos, el ruido de fondo y el lenguaje técnico. Además, permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés. OpenAI lanzó los modelos y el código para que sirvan como base para crear aplicaciones útiles que aprovechen el reconocimiento de voz.

¿Qué es GPT-3?

GPT-3 es un modelo de lenguaje de OpenAI que puede generar texto. Está entrenado en un gran conjunto de datos de texto de la web.

¿Cómo empezar?

Este tutorial es una actualización del tutorial anterior Whisper API con Flask y Docker.

Así que por favor primero échale un vistazo 🙂 Si ya lo hiciste, puedes continuar aquí.

Clave API de OpenAI

Si aún no lo tiene, vaya a OpenAI y cree una cuenta. Y crea tu clave API. ¡Nunca comparta su clave API en un repositorio público!

Actualizaciones a requerimiento.txt

Estamos agregando el paquete openai a nuestro archivo.

Crear archivo para la función gpt3

Crearemos un nuevo archivo llamado gpt3.py y le agregaremos el siguiente código. En el indicador, estaba usando la opción de resumen para resumir el texto, pero puede usar lo que quiera. Y también puede ajustar los parámetros.

Actualizar app.py

En la parte superior actualizaremos nuestras importaciones. En lugar de «MY_API_KEY», inserte la clave API que creó anteriormente.

Actualizar la ruta /susurro

Integraremos nuestra nueva función GPT3 en la ruta. Entonces, cuando obtengamos el resultado de susurro, lo pasaremos a la función gpt3 y devolveremos el resultado.

¿Cómo ejecutar el contenedor?

  • Abra una terminal y navegue a la carpeta donde creó los archivos.
  • Ejecute el siguiente comando para construir el contenedor:
  • Cuando la compilación esté lista, ejecute el siguiente comando para ejecutar el contenedor:
  • ¿Cómo probar la API?

  • Puede probar la API enviando una solicitud POST a la ruta http://localhost:5000/whisper con un archivo dentro. El cuerpo debe ser datos de formulario.
  • Puede usar el siguiente comando curl para probar la API:
  • Como resultado, debe obtener un objeto JSON con la transcripción y el resumen.
  • ¿Cómo implementar la API?

    Esta API se puede implementar en cualquier lugar donde se pueda usar Docker. Solo tenga en cuenta que esta configuración actualmente usa CPU para procesar los archivos de audio. Si desea usar GPU, debe cambiar Dockerfile y compartir la GPU. No voy a profundizar en esto ya que esto es una introducción. GPU acoplable

    Puedes encontrar el código completo aquí

    Gracias ¡para leer! Si disfrutaste este tutorial, puedes encontrar más y continuar leyendo en nuestra página de tutoriales.

    Deja un comentario

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Scroll al inicio