Tutorial de Stable Diffusion: Crear un avatar animado de ti mismo con Stable Diffusion

Tutorial de Stable Diffusion: Crear un avatar animado de ti mismo con Stable Diffusion

¿Alguna vez te has preguntado cómo se vería una versión animada de ti mismo? Con Stable Diffusion, ya no necesita preguntarse más, en su lugar, puede crear un avatar estilo Disney Pixar de usted mismo usando un simple ingreso de texto. Si eres nuevo en Stable Diffusion echa un vistazo a este tutorial y explicación aquí

En este tutorial, lo guiaremos a través de los pasos para crear un avatar animado estilo Pixar de usted mismo.

Introducción a la difusión estable

Antes de comenzar, hay algunos requisitos básicos; que enumeraremos a continuación:

  • GPU Nvidia con al menos 4GB de VRAM
  • Interfaz de usuario web de difusión estable: descarga desde Github
  • Archivo de punto de control Stable Diffusion 1.5
  • Un retrato tuyo o cualquier otra imagen para usar.
  • Configuración del entorno

    A continuación se muestran los pasos para configurar su entorno local para el proyecto:

    Paso 1: Extraiga el proyecto de difusión estable

    El proyecto de interfaz de usuario web Stable Diffusion debe descargarse en su disco local. Puede clonar el repositorio de Github o descargar el proyecto como un archivo ZIP y descomprimirlo en una carpeta en su disco local. A su lista de archivos y carpetas le debería gustar la imagen de abajo:

    Paso 2: archivo de punto de control de difusión estable

    A continuación, tenemos que mover el archivo de control de difusión estable, que descargamos de Hugging face al carpeta modelsstable-difusion:

    Una vez que el archivo se copia en la carpeta modelsstable-diffusion, debe cambiarle el nombre a modelo.chkptcomo se muestra en las siguientes capturas de pantalla:

    Paso 3: Ejecución de WebUI

    Ahora que completamos los pasos anteriores, estamos listos para iniciar la interfaz de usuario web de difusión estable. Podemos hacer esto ejecutando «webui-user.bat» en la carpeta del proyecto de difusión estable, como se muestra en la imagen a continuación:

    Pero, antes de que podamos hacer eso, tenemos que modificar el archivo «webui-user.bat» para hacer referencia a nuestra instalación local de Python. Puede editar el archivo «webui-user.bat» con un editor de su elección, el Bloc de notas también funcionará. El contenido de «webui-user.bat» se verá similar a las líneas a continuación;

    Ahora que ya tenemos todo configurado con el archivo «webui-user.bat», ¡podemos hacer doble clic en el archivo para ejecutarlo!

    Abra su navegador Chrome y navegue a la siguiente URL http://127.0.0.1:7860 que iniciará la interfaz de usuario de Gradio. La pantalla se parecerá a la imagen de abajo;

    A continuación, podemos comenzar a jugar con las generaciones de imagen a imagen.

    Paso 4: Generación de la imagen

    En la pestaña «img2img», arrastre y suelte una foto de su elección y ajuste la configuración que se adapte al hardware de su PC. Si tiene una buena tarjeta gráfica, como una NVidia RTX3060 con suficiente VRAM, puede aumentar la resolución, hasta al menos 1024×1024.

    Si está utilizando una imagen de usted mismo, puede probar el siguiente mensaje de entrada de texto;

    Pixar, personaje de Disney, representación 3D, alta calidad, representación suave, una chica con gafas, camiseta negra, linda sonrisa

    Además, recuerde que la escala CFG (Classifier Free Guidance) y la fuerza de eliminación de ruido tienen un efecto significativo en los resultados finales. Aquí hay algunos consejos para ajustar la configuración para mejorar los resultados:

  • Aumentar el valor de Eliminación de ruido crea un resultado que se parece menos a su imagen original
  • Cuanto más alta sea la escala CFG, más estricta se le indicará a la Difusión estable que siga las instrucciones de su mensaje, aunque conduce a algunas anomalías.
  • Para este ejemplo, descubrí que el valor más apropiado para el parámetro de intensidad de reducción de ruido es 0.7 y la escala CFG de 11.0. La imagen de abajo es el resultado final en comparación con la foto original.

    ¡Y eso es todo para crear un avatar de ti mismo al estilo de Disney Pixar, usando Stable Diffusion! Te animo a que juegues con la configuración y uses diferentes imágenes de referencia para ver qué resultados obtienes.

    ¡Espero que te diviertas tanto como yo creando imágenes nuevas y creativas! Para obtener más información sobre Stable Diffusion y otros modelos avanzados de IA, eche un vistazo a los otros excelentes tutoriales que se ofrecen en Lablab.ai. También puede comunicarse con la creciente comunidad de Lablab.ai en el canal Discord para conocer e interactuar con personas de ideas afines https://discord.gg/lablab-ai-877056448956346408.

    Suscríbase al canal de YouTube de Nextgrid, donde encontrará información útil sobre los Hackatones de IA pasados ​​y futuros y algunas entrevistas con algunos de los expertos líderes de la industria en IA. ¡Espero que hayas disfrutado leyendo y trabajando en este tutorial!

    Usé las siguientes referencias para hacer este tutorial:

    Deja un comentario

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

    Scroll al inicio