Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи?

Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи? - Изображение 1 из 8

Мы являемся свидетелями серьезного изменения в процессе создания изображений. Недавний приток и рост машинного обучения и искусственного интеллекта поднимает вопросы о том, как творческие процессы развиваются и развиваются с помощью технологий. Такие системы, как DALL-E, DALL-E 2 и Midjourney, представляют собой программы искусственного интеллекта, обученные генерировать изображения из текстовых описаний с использованием набора данных пар текст-изображение. Разнообразный набор возможностей включает в себя создание антропоморфизированных версий животных и объектов, правдоподобное объединение несвязанных понятий и применение преобразований к существующим изображениям.

DALL-E и подобные системы способны создавать правдоподобные изображения для самых разных предложений, которые исследуют композиционную структуру языка. DALL-E обладает некоторыми возможностями механизма 3D-рендеринга, но разница заключается в характере входных данных. Для 3D-рендеринга входные данные должны быть указаны полностью подробно, в то время как DALL-E часто может «заполнить пробелы». Он также может независимо управлять атрибутами небольшого количества объектов.

Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи? - Изображение 5 из 8

Одной из самых интересных функций является возможность комбинировать несвязанные понятия. Эта способность может иметь значение для областей архитектуры и дизайна, поскольку архитектура и дизайн продуктов могут черпать вдохновение из, казалось бы, несвязанных концепций. Генеративные модели искусственного интеллекта побуждают дизайнеров исследовать больше возможностей дизайна с новой точки зрения, поскольку это сокращает время между замыслом и исполнением. Они предлагают доступный способ игры с данными и создания творческих вариантов решения творческих задач.

Некоторые исследователи называют эти системы «искусственной счастливой случайностью» — системами, которые максимизируют возможности случайной удачи, открывая диапазон творческих возможностей за пределами классических методов. Архитекторы уже экспериментируют с этими инструментами, чтобы исследовать сложные вопросы, такие как городское планирование и возможности существующих пространств. Другие комбинируют архитектурные ключевые слова с клише современного дизайна, отсылками к поп-культуре и различным художественным стилям для проектирования зданий или просто исследуют природу тенденций и технологий дизайна.

Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи? - Изображение 2 из 8

Хотя эти модели имеют ограничения, эта область развивается с беспрецедентной скоростью. Недавно Apple выпустила Gaudi, «нейронного архитектора», который продвигает этот процесс на шаг дальше, создавая 3D-сцены из текстовых подсказок, таких как «поднимитесь наверх» или «пройдите через коридор». Трудно предсказать, куда нас приведут эти события, но их влияние уже можно почувствовать. В области архитектуры и дизайна их можно рассматривать как мощные инструменты для быстрого исследования, оптимизации и тестирования творческих проектов.

Могут ли системы искусственного интеллекта, такие как DALL-E или Midjourney, выполнять творческие задачи? - Изображение 3 из 8