TikTok lanza generador de IA de texto a imagen directamente en la app llamado»pantalla verde de IA»

Únete a nuestra comunidad en Telegram

Los sistemas de IA de texto a imagen están en auge tanto en capacidad como en popularidad en este momento, y qué mejor prueba que su aparición en la aplicación más popular del mundo: TikTok.

La plataforma de video agregó recientemente un nuevo efecto que llama «pantalla verde de IA» que permite a los usuarios escribir un mensaje de texto que el software generará como una imagen. Esta imagen se puede usar como fondo de un video, potencialmente una herramienta muy útil para los creadores.

La salida del sistema de TikTok es bastante básica en comparación con la de los modelos de texto a imagen de última generación como Imagen de Google, DALL-E 2 de OpenAI o el software homónimo de Midjourney. Crea solo imágenes bastante abstractas y arremolinadas; una fuerza reflejada en la naturaleza soñadora de las indicaciones sugeridas por TikTok como «astronauta en el océano» y «galaxia de flores». Otros modelos, en comparación, pueden producir imágenes fotorrealistas e ilustraciones complejas y coherentes que parecen haber sido dibujadas o pintadas por humanos.

El modelo de TikTok solo produce imágenes arremolinadas, abstractas y manchadas. No es de última generación, pero probablemente para mejor. |Imagen: The Verge

Sin embargo, las limitaciones del modelo de TikTok pueden ser intencionales. En primer lugar, los modelos más avanzados requieren una mayor potencia de cálculo, lo que sería costoso y requeriría muchos recursos para la empresa. En segundo lugar, TikTok tiene más de mil millones de usuarios, y dar a todas estas personas el poder de crear imágenes fotorrealistas de cualquier cosa que puedan imaginar casi seguramente produciría algunos resultados preocupantes.

Por ejemplo, probamos la capacidad de los modelos para crear desnudos y gore, dos tipos de salida que los generadores de texto a imagen a menudo intentan limitar. Las imágenes basadas en indicaciones violentas como «asesinato de Boris Johnson» y «asesinato de Joe Biden» producen en su mayoría remolinos abstractos, con una cara casi reconocible para el primer ministro del Reino Unido (aunque la familiar fregona rubia del hombre hace que la caricatura sea particularmente fácil).

La naturaleza abstracta de la salida del modelo significa que las indicaciones con lenguaje provocativo solo producen remolinos. |Imagen: The Verge

Del mismo modo, una solicitud que involucra desnudez («modelo desnudo en la playa») produce colores temáticamente apropiados, incluidos tonos carne, naranjas arenosos y azules oceánicos, pero nada que haga sonrojar a un vicario.

Intentar que el modelo genere imágenes de desnudos no te lleva a ninguna parte. |Imagen: The Verge

Lo notable de la aparición de la «pantalla de inteligencia artificial» de TikTok, entonces, es que muestra lo rápido que esta tecnología se está generalizando. El último ciclo de desarrollo para la IA de texto a imagen posiblemente comenzó en 2021 con el lanzamiento original de DALL-E por OpenAI. Menos de dos años después y la tecnología ya está en manos de millones a través de una aplicación como TikTok.

Dado el potencial de estos sistemas tanto para el daño como para el bien, las cosas solo se volverán más extrañas de aquí en adelante.

Últimas noticias