
¿Qué es Susurro?
Whisper es un sistema automático de reconocimiento de voz de última generación de OpenAI que ha sido entrenado en 680 000 horas de datos supervisados multilingües y multitarea recopilados de la web. Este conjunto de datos grande y diverso conduce a una mayor solidez de los acentos, el ruido de fondo y el lenguaje técnico. Además, permite la transcripción en varios idiomas, así como la traducción de esos idiomas al inglés. OpenAI lanzó los modelos y el código para que sirvan como base para crear aplicaciones útiles que aprovechen el reconocimiento de voz.
Cómo empezar con Docker
whisper-api
En el Dockerfile añadiremos las siguientes líneas:
Entonces, ¿qué está sucediendo exactamente en el Dockerfile?
python-docker
Cómo crear nuestra ruta
¿Cómo ejecutar el contenedor?
¿Cómo probar la API?
http://localhost:5000/whisper
con un archivo dentro. El cuerpo debe ser datos de formulario.¿Cómo implementar la API?
Esta API se puede implementar en cualquier lugar donde se pueda usar Docker. Solo tenga en cuenta que esta configuración actualmente usa CPU para procesar los archivos de audio. Si desea usar GPU, debe cambiar Dockerfile y compartir la GPU. No voy a profundizar en esto ya que esto es una introducción. GPU acoplable
Puedes encontrar el código completo aquí
Gracias ¡para leer! Si disfrutaste este tutorial, puedes encontrar más y continuar leyendo en nuestra página de tutoriales.