Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи?
Мы являемся свидетелями серьезного изменения в процессе создания изображений. Недавний приток и рост машинного обучения и искусственного интеллекта поднимает вопросы о том, как творческие процессы развиваются и развиваются с помощью технологий. Такие системы, как DALL-E, DALL-E 2 и Midjourney, представляют собой программы искусственного интеллекта, обученные генерировать изображения из текстовых описаний с использованием набора данных пар текст-изображение. Разнообразный набор возможностей включает в себя создание антропоморфизированных версий животных и объектов, правдоподобное объединение несвязанных понятий и применение преобразований к существующим изображениям.
DALL-E и подобные системы способны создавать правдоподобные изображения для самых разных предложений, которые исследуют композиционную структуру языка. DALL-E обладает некоторыми возможностями механизма 3D-рендеринга, но разница заключается в характере входных данных. Для 3D-рендеринга входные данные должны быть указаны полностью подробно, в то время как DALL-E часто может «заполнить пробелы». Он также может независимо управлять атрибутами небольшого количества объектов.
Одной из самых интересных функций является возможность комбинировать несвязанные понятия. Эта способность может иметь значение для областей архитектуры и дизайна, поскольку архитектура и дизайн продуктов могут черпать вдохновение из, казалось бы, несвязанных концепций. Генеративные модели искусственного интеллекта побуждают дизайнеров исследовать больше возможностей дизайна с новой точки зрения, поскольку это сокращает время между замыслом и исполнением. Они предлагают доступный способ игры с данными и создания творческих вариантов решения творческих задач.
Некоторые исследователи называют эти системы «искусственной счастливой случайностью» — системами, которые максимизируют возможности случайной удачи, открывая диапазон творческих возможностей за пределами классических методов. Архитекторы уже экспериментируют с этими инструментами, чтобы исследовать сложные вопросы, такие как городское планирование и возможности существующих пространств. Другие комбинируют архитектурные ключевые слова с клише современного дизайна, отсылками к поп-культуре и различным художественным стилям для проектирования зданий или просто исследуют природу тенденций и технологий дизайна.
Хотя эти модели имеют ограничения, эта область развивается с беспрецедентной скоростью. Недавно Apple выпустила Gaudi, «нейронного архитектора», который продвигает этот процесс на шаг дальше, создавая 3D-сцены из текстовых подсказок, таких как «поднимитесь наверх» или «пройдите через коридор». Трудно предсказать, куда нас приведут эти события, но их влияние уже можно почувствовать. В области архитектуры и дизайна их можно рассматривать как мощные инструменты для быстрого исследования, оптимизации и тестирования творческих проектов.
Примечание редактора. Эта статья была первоначально опубликована 15 августа 2022 г.