Un bâtiment inspiré par les formes d’une zèbre vu par l’IA.
Depuis 2022 sont disponibles pour l’usage du grand publique des applications de génération d’image à partir d’un script et basées sur l’intelligence artificielle (IA).
Cela fait de nombreuses années que les chercheurs travaillent sur des techniques de génération d’images utilisant l’intelligence artificielle. En 2022, une étape a été franchie avec l’ouverture des modèles à un public non spécialisé. Et surtout, il est enfin possible d’alimenter les modèles (text-to-image) avec des instructions en langage naturel, appelées des ‘prompts’.
Les solutions les plus populaires sont DALL-E, Craiyon, Imagen, Midjourney et Stable diffusion et bien d’autres.
Nous avons voulu tester la capacité de conception de l’IA à partir d’un script simple où nous demandions d’imaginer un bâtiment inspiré par le corp d’un zèbre et exploitant la texture zébrée : simple clin d’œil à notre nom de société Zebrandco.
Voici le résultat de quelques heures de travail avec l’outil Midjourney et sans retouches.
C’est à la fois époustouflant, très abstrait, rempli d’erreurs de conception et de divers biais, mais intéressant comme base d’inspiration.
Exemple d’une modification de script:
Le résultat d’un script identique, mais en demandant d’enlever l’animal de l’image et de garder uniquement une inspiration de texture. Nous ajoutons dans le script toujours une référence à un artiste-peintre d’art contemporain pour forcer un style graphique spécifique.
Que dit une autre IA sur l’intérêt d’utiliser les générateurs d’image dans l’architecture?
Nous avons profité de la sortie récente du ChatGPT qui est une IA de génération de contenu pour poser la question à l’algorithme.
Notre question : Les générateurs d’image text-to-image de dernière génération, sont-ils intéressants à utiliser pour les architectes? Vont-ils les remplacer dans l’étape de conception?
La réponse sensée de l’algorithme ChatGPT (Open-AI) rédigée en quelques secondes:
“Il est difficile de prédire si les générateurs d’image text-to-image de dernière génération comme DALL-E ou Stable Diffusion ou Midjourney seront utilisés de manière significative par les architectes dans leur processus de conception. Bien qu’ils puissent être capables de générer des images de bâtiments et d’espaces de manière convaincante, ils ne remplaceront probablement pas complètement les architectes dans l’étape de conception.
Les architectes sont des professionnels hautement qualifiés et expérimentés qui ont été formés pour comprendre les besoins et les souhaits des clients, ainsi que les réglementations et les contraintes techniques liées à la conception de bâtiments et d’espaces. Ils sont également en mesure de réfléchir de manière créative et de trouver des solutions uniques et innovantes à des problèmes complexes. En comparaison, les générateurs d’image text-to-image sont des outils qui peuvent être utilisés pour générer des images basées sur du texte ou des descriptions données, mais ils ne peuvent pas remplacer la créativité et l’expérience de l’architecte.
En fin de compte, il est probable que les générateurs d’image text-to-image soient utilisés de manière complémentaire aux compétences des architectes, plutôt que de les remplacer complètement. Ils pourraient être utilisés pour générer rapidement des idées de base ou des maquettes de conception, mais ils ne remplaceront pas la nécessité de travailler en étroite collaboration avec des clients et d’autres professionnels pour élaborer une conception finale détaillée et réalisable.”
Que peut-on ajouter? Voilà que nous allons bientôt pouvoir nous reposer !!