Acceder Registrarme

STABLE DIFFUSION Y LA GENERACIÓN DE IMÁGENES


Dentro del sector de la inteligencia artificial y, siendo más específicos en la generación de imágenes generadas por ordenador; existe un modelo de inteligencia artificial que es open source y fue desarrollado gracias a la gente de Stability.ai. Mediante este modelo podemos generar imágenes a través a de una cadena de texto y no solo eso, sino que también existen plataformas que nos permiten usarlo con funcionalidades extra y de manera gratuita, ahorrándonos así los costos computacionales.

Autor: Tomas Rojas (Ver todos sus post)

Stable Diffusion IA NLP Lexica

Fecha de publicación: 2022-11-02 08:48:26
Ayúdanos con el arduo trabajo que realizamos.
[INTELIGENCIA ARTIFICIAL] STABLE DIFFUSION Y LA GENERACIÓN DE IMÁGENES

Stable Diffusion, es un modelo de IA generador de imágenes, así como Dall-e 2 o middjourney, pero con la característica principal de que es de código abierto, podemos encontrar el código fuente y su documentación en su Github.

Su uso es sencillo, simplemente tipeamos la idea de la imagen que deseamos obtener y el modelo por si mismo generará una imagen con respecto al texto. Es importante reconocer de que mientras más complejo y detallado sea nuestor input o prompt, nuestro resultado será mucho más preciso.

Actualmente se encuentra en la versión 1.5 y si nosotros queremos utilizar este modelo, mínimamente se requiere 10 GB de memoria en la tarjeta de video, pero una buena alternativa ante ello es el uso de Colab, quien nos suministrará del cómputo necesario para poder experimentar con la aplicación.

Si no sabes por que imagen empezar a generar o si tienes dudas de cómo debería ser el prompt que emitas al modelo, puedes tomar los miles de ejemplos que se encuentran disponibles en Lexica, este es un sitio que almacena imágenes, y, dentro de cada imagen especifica el prompt que se le dio, la semilla de la imagen y la escala que se encuentra.

A la fecha que se redacta este artículo, existen adaptaciones que se añadió para poder integrar imágenes que no estén dentro de su data set, dándonos así la capacidad de incluir nuestras propias imágenes; podríamos subir fotos nuestras para que el modelo aprenda los patrones de nuestro rostro y posterior a ello generar imágenes en base al texto que deseemos. Si queremos ver más sobre este último tema, les recomiendo el canal de youtube de dotcsv

CONCLUSIÓN

Si bien es cierto, la inteligencia artificial avanza a grandes pasos y para bien, pero, se da el caso de que también puede tener usos negativos, como toda herramienta. Es cierto de que modelos como dall-e censura el resultado de aquellos contenidos cruentos o los que se estima que pueden dañar la reputación de alguna persona, de igual modo, Dream Studio censura imágenes que pueden ser consideradas obscenas, pero al ser de código abierto SD, da la posibilidad de saltar esta valla. Por ello, el uso de estos modelos debe darse con responsablidad.



...

INFORMACIÓN SOBRE EL AUTOR DEL ARTÍCULO
TOMAS ANGEL ROJAS ALVAREZ : Soy una persona proactiva y responsable con las actividades que tenga a mi cargo. El compromiso laboral que manejo se basa en garantizar un trabajo de calidad, realizado de forma eficiente y eficaz, ya que, poseo las habilidades y valores necesarios; así mismo, mi persona siempre está dispuesta a aprender y tomar en consideración las recomendaciones de mi entorno laboral.


  • Debes estar logueado para realizar comentarios