
¿Qué es Susurro?
Whisper es un sistema automático de reconocimiento de voz de última generación de OpenAI que ha sido entrenado en 680 000 horas de datos supervisados multilingües y multitarea recopilados de la web. Este conjunto de datos grande y diverso conduce a una mayor solidez de los acentos, el ruido de fondo y el lenguaje técnico. Además, permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés. OpenAI lanzó los modelos y el código para que sirvan como base para crear aplicaciones útiles que aprovechen el reconocimiento de voz.
¿Qué es GPT-3?
GPT-3 es un modelo de lenguaje de OpenAI que puede generar texto. Está entrenado en un gran conjunto de datos de texto de la web.
¿Cómo empezar?
Este tutorial es una actualización del tutorial anterior Whisper API con Flask y Docker.
Así que por favor primero échale un vistazo 🙂 Si ya lo hiciste, puedes continuar aquí.
Clave API de OpenAI
Si aún no lo tiene, vaya a OpenAI y cree una cuenta. Y crea tu clave API. ¡Nunca comparta su clave API en un repositorio público!
Actualizaciones a requerimiento.txt
Estamos agregando el paquete openai a nuestro archivo.
Crear archivo para la función gpt3
Crearemos un nuevo archivo llamado gpt3.py y le agregaremos el siguiente código. En el indicador, estaba usando la opción de resumen para resumir el texto, pero puede usar lo que quiera. Y también puede ajustar los parámetros.
Actualizar app.py
En la parte superior actualizaremos nuestras importaciones. En lugar de «MY_API_KEY», inserte la clave API que creó anteriormente.
Actualizar la ruta /susurro
Integraremos nuestra nueva función GPT3 en la ruta. Entonces, cuando obtengamos el resultado de susurro, lo pasaremos a la función gpt3 y devolveremos el resultado.
¿Cómo ejecutar el contenedor?
¿Cómo probar la API?
http://localhost:5000/whisper
con un archivo dentro. El cuerpo debe ser datos de formulario.¿Cómo implementar la API?
Esta API se puede implementar en cualquier lugar donde se pueda usar Docker. Solo tenga en cuenta que esta configuración actualmente usa CPU para procesar los archivos de audio. Si desea usar GPU, debe cambiar Dockerfile y compartir la GPU. No voy a profundizar en esto ya que esto es una introducción. GPU acoplable
Puedes encontrar el código completo aquí
Gracias ¡para leer! Si disfrutaste este tutorial, puedes encontrar más y continuar leyendo en nuestra página de tutoriales.