Не хуже людей: как нейросети рисуют слонобабочек и придумывают идеи для бизнеса

Не хуже людей: как нейросети рисуют слонобабочек и придумывают идеи для бизнеса

Эксперт в области нейросетей для гражданского применения и гендиректор Университета «Зерокодер» Кирилл Пшинник относится к техно-оптимистам. В своей книге «Искусственный интеллект: путь к новому миру» он рассказывает историю развития искусственного интеллекта, начиная с первых шагов новой технологии и до сегодняшнего дня, когда такими инструментами, как ChatGPT и Midjourney уже, кажется, умеет пользоваться каждый школьник (иногда лучше, чем взрослые).

Пшинник также предлагает свой визионерский взгляд на то, как именно генеративные нейросети уже в ближайшем будущем изменят бизнес, рынок труда и нашу повседневную жизнь в целом. По его мнению — в основном к лучшему, но о возможных рисках непредвиденных последствий обретения ИИ автономии и сверхчеловеческих возможностей он тоже предупреждает. 

Книга Кирилла Пшинника «Искусственный интеллект: путь к новому миру» выходит в апреле в издательстве АСТ. Forbes публикует отрывок. 

Различные эксперименты и исследования показывают, что ИИ может внести вклад в технологический процесс как раз благодаря своей креативности и уникальному голосу. Одна из самых любимых тем любителей технологий — изобретения, которые были описаны фантастами и в итоге нашли воплощение в реальности. Многие из технологий пока все еще остаются в области фантастики, потому что человек не смог найти ключ к их реализации. Это касается не только технологической сферы. Мы до сих пор не можем найти лекарство от рака, или остановить старение, или ответить на вопрос о том, есть ли жизнь на других планетах. ИИ может стать ключом к решению этих проблем и сложных вопросов благодаря его «нестандартному мышлению». 

И это уже происходит. Например, математики из Австралии и специалисты британской компании Deepmind с помощью нейросетей смогли найти решение для одной из гипотез, связанных с так называемыми многочленами Каждана-Люстига. Ученые не могли самостоятельно доказать эту теорему более 40 лет. Вполне вероятно, нейросеть сделала это случайно, просто перебирая варианты. Но люди делают это так же! И часто научные открытия происходят из-за случайности, например, как изобретение пенициллина. Поэтому в будущем нейросети смогут решать различные задачи, стоящие перед человечеством, не хуже, а возможно — даже лучше людей. Как минимум, ИИ способен проанализировать больше данных, чем человек, и, соответственно, у него больше возможностей найти между ними закономерности. 

Нейросетям не передались и другие ограничения естественного интеллекта. Мы, как установил американский ученый-психолог Джордж Миллер, способны одновременно жонглировать очень небольшим набором данных. В среднем человек может одновременно держать в уме не более девяти элементов. Эту особенность нашей памяти описал американский ученый-психолог Джордж Миллер как «магическое число семь плюс-минус два». У систем ИИ нет подобных ограничений, поэтому они способны «подсвечивать» слепые зоны в наших исследованиях и рассуждениях, предлагать больше решений, чем мы. Более того, они могут подсказывать решения, до которых мы сами никогда бы не додумались. Блестящий пример на эту тему описан в одной из хрестоматийных книг по искусственному интеллекту. В 2016 году система ИИ AlphaGo выиграла матч из пяти партий в го у одного из лучших в мире игроков Ли Седоля. Это потрясло как мир разработчиков ИИ, так и мир игроков в го: «Тридцать седьмой ход AlphaGo, сделанный системой во второй партии, стал сенсацией. Объяснить весь его смысл, не углубляясь в стратегию го, будет трудно, но если вкратце, то это был ход, который не сделал бы ни один человек в мире. ИИ показал, что он мыслит иначе, чем мы». 

Кроме того, нейросети могут стимулировать креативность человека, развивая его дивергентное мышление — способность искать неординарные идеи. Она помогает нам находить что-то прорывное для стартапов, создавать структуру книги или готовить блюдо из того, что осталось в холодильнике. Генеративный искусственный интеллект может поддерживать дивергентное мышление, выстраивая ассоциации между отдаленными концепциями, и на их основе генерировать идеи. Например, группа исследователей провела эксперимент и попросила модель Midjourney создать изображение, сочетающее в себе слона и бабочку. Она произвела на свет химеру, которую авторы исследования назвали фантафлаем (phantafly). После этого они попросили Stable Diffusion, еще одну популярную нейросеть, придумать дизайны стульев и шоколада, вдохновившись этим новым существом. 

Используя такую методику — цифровую аналогию дивергентного мышления человека, — специалисты и бизнес могут быстро разрабатывать новые концепции объектов и продуктов. Бренд одежды может таким же образом загружать в модель последние модные тренды и просить на их основе генерировать новые дизайны и принты. 

Рассмотрим другой пример того, как эта технология может соединять идеи для создания концепций, которые человек или даже целая компания могли бы не придумать сами. Можно просить ChatGPT генерировать идеи через процесс трисоциации, соединяя три различных сущности (расширение техники творчества бисоциации). Например, можно дать модели такую задачу: «Ты будешь играть роль идейного вдохновителя. Ты случайным образом генерируешь 10 общих существительных. Затем ты случайным образом выберешь любые два из этих 10 существительных. После этого ты спросишь меня о третьем существительном. Ты создашь бизнес-идею, объединяя или ассоциируя два выбранных существительных и выбранное мной существительное». ChatGPT сгенерировал существительные «еда» и «технология». Далее авторы дали модели дополнительное существительное — «автомобиль», и ChatGPT мгновенно предложил следующую бизнес-идею: «Умный сервис доставки еды, использующий беспилотные автомобили для транспортировки блюд клиентам. Аспект технологии может включать в себя использование искусственного интеллекта для оптимизации маршрутов доставки, отслеживание температуры продуктов и предоставление клиентам обновлений о статусе их заказов в реальном времени. Сервис может быть направлен на занятых профессионалов и семьи, которые ищут удобные и здоровые варианты питания без ущерба вкусу и качеству». На другом этапе ChatGPT сгенерировал существительные «авиакомпания» и «стул». Когда мы предоставили «университет», ChatGPT предложил бизнес-концепцию, предоставляющую удобный и экономичный способ для студентов и ученых путешествовать на конференции и семинары по всему миру, а также доступ к библиотеке учебных книг во время полета. Предложено было название компании: Fly and Study или Edu-Fly. 

Кроме того, нейросети не обладают страхами, привычками и представлениями, которые во многом ограничивают нас и нашу фантазию. Получается, если вы отдадите им на откуп некоторые свои задачи, они смогут создавать совершенно неожиданные вещи. 

Нейросети могут стимулировать креативное мышление и в другом ключе. Часто специалисты ограничены в своей креативности из-за излишней экспертности — знания правил, ГОСТов и пр. Возьмем пошив одежды: следуя установленным правилам, можно создавать красивую носибельную одежду, но вряд ли получится придумать новую форму. Или же часто предмет привыкли шить из одной ткани и не решаются ее поменять, потому что это не по правилам. Но именно дизайнеры, которые выходят за рамки общепринятого, двигают индустрию вперед. Одежда и обувь, придуманная искусственным интеллектом, вполне может вдохновить дизайнеров на собственные эксперименты — как с использованием ИИ, так и без него. 

На ранних этапах разработки нового продукта нетипичный дизайн, созданный генеративным искусственным интеллектом, может вдохновить дизайнеров выйти за рамки своих предубеждений о том, что возможно или желательно воплотить в продукте с точки зрения формы и функций. Этот подход может привести к решениям, которые люди, возможно, никогда не могли бы себе представить при использовании традиционного подхода, когда сначала определяются функции, а затем разрабатывается форма, учитывающая их. Вот пример этого процесса: авторы исследования попросили Stable Diffusion разработать игрушечных крабов. Никаких дополнительных данных, помимо формы, они модели не задавали. Уже получив несколько готовых дизайнов, исследователи попытались представить, что могли бы делать такие игрушки. Так, одно из изображений напомнило им настенную игрушку, а другое — медленную кормушку для собак. 

Инструменты на основе генеративного интеллекта могут не только помогать генерировать идеи — по сути, участвовать в брейнштормах, — но и оценивать задумку, в том числе с точки зрения бизнеса. 

Представим, что нам нужно найти способ минимизировать количество пищевых отходов. У нас есть три сырые идеи: упаковка с динамическими сроками годности (этикетки автоматически меняют либо дату, либо цвет в зависимости от условий окружающей среды в местах их хранения); приложение, с помощью которого человек может пожертвовать излишки из своего холодильника; и информационная кампания о том, что они представляют собой с точки зрения свежести и пригодности к использованию. ChatGPT провел сбалансированный анализ плюсов и минусов, как если бы это сделал человек. Например, оценивая концепцию упаковки с динамическим сроком годности, нейросеть решила, что она поможет потребителям лучше понять срок годности продуктов и побудит производителей выпускать партии меньшего размера, таким образом в магазинах будет чаще обновляться продукция. Кроме того, ChatGPT отметил, что динамические сроки годности могут потребовать значительных изменений в процессе производства и упаковки и, как следствие, увеличить затраты как производителей, так и потребителей. 

ChatGPT определил, что приложение для пожертвования еды может побудить людей использовать свою еду до того, как она испортится, и сократить пищевые отходы, раздавая неоткрытую еду нуждающимся. Он предупредил, что для эффективности приложения может потребоваться большая база пользователей и что транспортировка и распространение продуктов питания из самых разных нерегулируемых источников может вызвать проблемы с безопасностью. Анализируя идею с информационной кампанией, модель обратила внимание на существенный недостаток задумки. Она отметила, что образовательная программа может оказаться слишком сложной, так как сроки годности не стандартизированы и варьируются от продукта к продукту. Из-за этого она может оказаться слишком дорогой, так как придется создавать слишком много образовательных материалов, к тому же она должна будет охватить широкую географию. Генеративный ИИ может выйти за рамки простых плюсов и минусов и помочь людям оценить такие аспекты творчества, как новизна, осуществимость, специфичность, влияние и работоспособность. 

Так или иначе, мир уже двигается в сторону, где ИИ играет большую роль в создании продуктов. Как я писал ранее, разработкой OpenAI и плагинами к нему активно пользуются программисты. Решения, адаптированные под задачи разработчиков, создают и в других компаниях. Meta (признана в России экстремистской организацией и запрещена), пытаясь нагнать OpenAI и Google, представила Code Llama — инструмент на базе ИИ, который ускоряет работу программистов, предлагая строки кода. В гонке участвует IBM со своей разработкой Watsonx Code Assistant. Нельзя не упомянуть и про Copilot GitHub, который пробуют в том числе и российские разработчики. 

По мере развития инструментов все чаще мелькают истории о том, как искусственный интеллект не просто помогает программистам в работе, но создает собственные продукты. В 2023 году исследователи из Северо-Западного университета представили робота, которого спроектировал искусственный интеллект, получив простую инструкцию вроде «спроектировать робота, способного ходить по плоской поверхности». Более свежие примеры включают ИИ-агента Eureka от разработчика оборудования NVIDIA Research. Он способен обучать роботов разнообразным навыкам: от открытия ящиков и шкафов до подбрасывания и ловли мячей или даже аккуратного обращения с ножницами. Программы, написанные Eureka, превосходят написанные экспертами в более чем 80% задач. Это приводит к среднему повышению производительности ботов более чем на 50%, а также ставит нас перед рядом экзистенциальных вопросов о будущем человечества. Рост самопрограммирующегося ИИ представляет угрозу для определенных секторов занятости — прогнозы вроде «Через пять лет не будет программистов» становятся все более реальными. Будущее разработчиков младшего и среднего звена кажется и вовсе туманным, поскольку ИИ постоянно превосходит их по всем направлениям. Возможно, им придется перейти на контролирующие функции и стать посредниками в общении между людьми и алгоритмами. 

Более того, растут риски непредвиденных последствий по мере того, как ИИ обретает автономию. Представьте себе ИИ, который за нас оптимизирует «производительность» и решает сделать это за счет эксплуатации уязвимых сообществ или охраняемых территорий. Действия человека подчас не поддаются логике, но мы научились их прогнозировать. Современные системы ИИ, по сути, являются черными ящиками. Понять, как система пришла к тому или иному выводу, бывает невозможно, даже если вы являетесь ее разработчиком или имеете доступ к коду. Как писал в своей книге «Взломать все» эксперт по кибербезопасности Брюс Шнайер, «исследователи до сих пор не знают, как именно система классификации изображений ИИ отличает черепаху от винтовки, не говоря уже о том, почему она принимает одно за другое». 

Тем не менее я — на светлой стороне. Я не верю в научно-фантастический кошмар. На мой взгляд, приход самообучающегося и самопрограммирующегося искусственного интеллекта приведет к беспрецедентному росту эффективности и продуктивности. Нейросети смогут в разы ускорить исследования и инновации, приводя к прорывам в области фармацевтики и материалов. Мы сможем увидеть взлет персонализированной медицины, где искусственный интеллект анализирует данные о здоровье пациента для создания индивидуальных методов лечения. Уже есть примеры самоуправляемых лабораторий. Они революционизируют процесс научных открытий, потенциально сокращая то, что традиционно потребовало бы в среднем 20 лет и $100 млн, до всего лишь одного года и $1 млн.

6