Tutorial de Stable Diffusion: creación de prototipos con la interfaz de usuario web de Stable Diffusion

Tutorial de Stable Diffusion: creación de prototipos con la interfaz de usuario web de Stable Diffusion

¿Qué es la difusión estable?

Bienvenido a este tutorial de Stable Diffusion sobre cómo usar la herramienta. Stable Diffusion es un modelo de difusión de texto a imagen de aprendizaje profundo lanzado en 2022.

Se utiliza principalmente para generar imágenes con descripciones de texto, aunque también se puede aplicar a otras tareas, como pintar, pintar y generar traducciones de imagen a imagen guiadas por un mensaje de texto.

¿Cómo usar la interfaz de usuario web de Stable Diffusion localmente?

El usuario de GitHub AUTOMÁTICO1111 ha creado una interfaz web de difusión estable que puede usar para probar el modelo localmente. Esto le ayudará a probar y validar ideas. Se basa en Gradio, una biblioteca de Python para crear componentes de interfaz de usuario.

Funciones de la interfaz web

  • Modos originales txt2img e img2img
  • Instalar y ejecutar el script con un clic (pero aún debe instalar python y git)
  • pintar
  • Repintando
  • Bosquejo de color
  • Matriz rápida
  • Difusión estable de lujo
  • Atención, especifica partes del texto a las que el modelo debería prestar más atención
  • Pestaña Extras con:
  • GFPGAN, red neuronal que arregla rostros
  • CodeFormer, herramienta de restauración facial como alternativa a GFPGAN
  • RealESRGAN, escalador de redes neuronales
  • ESRGAN, escalador de redes neuronales con muchos modelos de terceros
  • SwinIR y Swin2SR (ver aquí), escaladores de redes neuronales
  • LDSR, aumento de escala de superresolución de difusión latente
  • Cambiar el tamaño de las opciones de relación de aspecto
  • Botón de artista aleatorio
  • Estilos, una forma de guardar parte del mensaje y aplicarlos fácilmente a través del menú desplegable más adelante
  • Variaciones, una forma de generar la misma imagen pero con pequeñas diferencias.
  • y mucho, mucho más…

    ¿Cómo utilizar la interfaz web?

    ventanas

  • Instale Python 3.10.6, marcando «Agregar Python a PATH»
  • Instalar git.
  • Descargue el repositorio stable-diffusion-webui, por ejemplo ejecutando git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git.
  • Sitio model.ckpt en el models directorio (consulte las dependencias para saber dónde obtenerlo).
  • (Opcional) Sitio GFPGANv1.4.pth en el directorio base, junto webui.py (ver dependencias para saber dónde conseguirlo).
  • Correr webui-user.bat desde Windows Explorer como usuario normal, no administrador.
  • linux

  • Instala las dependencias:
  • Para instalar en /home/$(whoami)/stable-diffusion-webui/correr:
  • silicio de manzana

    Encuentra las instrucciones aquí.

    Si desea consultar el repositorio de GitHub, puede encontrarlo aquí

    Para obtener el mejor resultado con las indicaciones de difusión estable, debe leer nuestra guía de indicaciones de difusión estable aquí. ¿Y tal vez quiera crear su propia herramienta basada en Stable Diffusion? ¡Entonces, únase a nuestro hackatón de IA de difusión estable!

    ¡Gracias! Si disfrutó de este tutorial, puede encontrar más y continuar leyendo en nuestra página de tutoriales: Fabian Stehle, pasante de ciencia de datos en New Native


    Comentarios

    Deja una respuesta

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *