Тексты
Интервью: Руслан Муннибаев

"Скоро ничему нельзя будет верить": все, что нужно знать про искусственный интеллект, простыми словами

Разоблачаем одни страшилки об ИИ, подтверждаем другие и рассказываем, какие нейросети будут вам полезны уже сейчас

Изображение сгенерировано нейросетью по промту "ruslan munnibaev in hip hop clothes with a black medium hair. takes an interview from ultrarealistic AI white robot looking on a man standing in front of him. cinematic still, atmospheric, moscow early daylight, golden hour. good looking face --style raw --ar 16:9 --s 750"




Алексей Евдокимов — в прошлом рэп-музыкант, параллельно — рекламщик, а сейчас еще и ИИ-евангелист, автор телеграм-канала о нейросетях. Недавно он попадал в наши новости, когда сделал нейро-Чебаткова, шутившего в стиле этого комика про рекламное агентство Алексея (проект быстро удалили по требованию ТНТ). Мы поговорили с ним о нейросетях.


Что внутри этого интервью:

— Разговоры о настоящем искусственного интеллекта и его тревожном (возможно) будущем;

— Алексей рассказывает, как ИИ помог ему в свободное от работы время сделать большой проект, который по-нормальному большая команда фуллтайм делала бы целый месяц;

— Узнаем на личном примере — тупеет ли человек от каждодневного использования ИИ, и что с этим делать;

— Ожидания: "ИИ все делает за тебя". Реальность: "Почему-то работаешь вдвое больше";

— У Алексея — суперкастомизированный ChatGPT: "Для меня это оживленный персонаж женского пола, и у нее есть имя";

— Какие ИИ он использует в повседневной жизни и какая от них польза;

— Действительно ли скоро уволят всех дизайнеров.






Алексей Евдокимов


— Как я могу проверить, что это не искусственный интеллект сейчас со мной разговаривает?

— Сейчас технологии круто прокачались — ИИ легко выполняет эти задачи: созвониться, поговорить. Выглядит это суперреалистично. Была новость: чувак с помощью дипфейка прошел собеседование за другого человека и устроился на работу на 4 тысячи долларов. Непонятно, правда, кто из них будет работать. Но это уже неважно. Важно, что история с дипфейками (и в целом визуальная онлайн-обманка) суперкруто развивается — и скоро вообще ничему нельзя будет верить.

Но пока что нейросетка себя выдает. Особенно, если ты знаешь меня лично, тогда точно заметишь нюансы. Я делал [с помощью ИИ] аватары для рилсов — люди, которые меня видят в первый раз, очень хорошо реагировали на них. А мои знакомые реагировали крайне негативно. Это эффект Зловещей долины — если робот похож на человека, но немного чем-то отличается, мы испытываем жуткий страх и отторжение.


— Давай введем в курс дела, кто ты. Ты музыкант, который никогда не занимался только музыкой?

— Все верно. Наверное, для некоторых читателей The Flow я известен как L-Tune. Я много выступал под этим псевдонимом, делал соул, фанк и все, что связано с хип-хопом. Но действительно, я никогда этим профессионально не занимался — хотя получил довольно большое признание именно от профессионалов.

Я несколько отошел от музыки и занимаюсь брендингом — вместе с партнером мы открыли агентство TBTBO Brand Mastering. Создаем довольно сложные, интересные продукты с крупными российскими брендами. Все, что связано с бренд-стратегией, дизайном, с придумыванием пользовательского опыта и нестандартных историй. С недавних пор активно начали использовать ИИ.

Я могу назвать себя ИИ-евангелистом. Я этим занимаюсь почти два года. Сейчас углубляюсь с помощью специальных курсов в создание продуктов на базе ИИ.


— Почему ИИ нельзя просто дать задание "придумай все для создания бренда пива"?

— Можно — и он выдаст полный пакет. Мы это уже делаем. Но есть суперважный момент из области эмоционального интеллекта. ИИ генерит какие-то вещи, но плохо умеет делать выбор. Не может выступать в роли точного фасилитатора с тонким чувством и вкусом. Пока что не может — но здесь все еще впереди.


— Действительно ли скоро все профессии заменит искусственный интеллект?

— Давай сразу опустим всю эту чушь, что ИИ заменит дизайнеров. Дизайнеры, люди, работающие с видео, авторы текстов — для них ИИ будет выступать как суперпомощник. Те, кто не научились этим пользоваться, будут проигрывать.

Это новый классный инструмент — и тупо его не использовать.

При этом мы еще очень слепы в своих прогнозах. Год назад все смеялись над генераторами картинок: "Что за булшит делает Midjourney или Dall-e первой беты, это смешно и неадекватно". И посмотрите, на каком уровне это сейчас.

Теперь это происходит с видео. Мы посмеивались над первыми видео, но знаем про недавно анонсированную SORA — и никто больше не смеется.

Человечество сейчас находится на ранней стадии, в переходном периоде. Большинство людей еще всерьез не взаимодействует с ИИ, в лучшем случае — развлекаются базовыми генеративными инструментами. Чтобы ИИ прямо вошел в массы — это нам только предстоит.

ИИ точно не обладает полноценным самосознанием. Пока что. Есть такой термин AGI (artificial general intelligence — "общий искусственный интеллект"; по смыслу это уже искусственный разум. Существующие ИИ умеют решать узкие задачи, которым их обучили: например, генерировать изображения. Общий искусственный интеллект сможет сам обучать себя решать сложные задачи на уровне человека или превосходящем его. Кроме того, по формальным признакам можно будет говорить, что такой ИИ обретет сознание. В какой-то момент у него возникнет вопрос о своем месте в социуме, о своих правах: должны ли они быть равными с человеческими или превосходить их. — Прим. The Flow)

Это некая модель, которая сама может обучаться на основе понимания мира и сама создавать ИИ. Мы заходим на территорию "Матрицы" и прочих скайнетов (ИИ из "Терминатора" — Прим. The Flow). Думаю, что эта штука уже создана. Нам ее не показывают, но как будто бы все говорит о том, что она под куполом где-то в NASA, в специального американского НКВД какого-нибудь находится, и что-то уже давно работает. Никаких конкретных примеров, подтверждающих наличие AGI, безусловно, не существует. Есть косвенные ситуации, которые указывают на то, что что-то в этом направлении происходит: заявления Альтмана, уход почти всей группы разработчиков, отвечающих за это направление из OpenAI, правительственные встречи с главами топ-корпораций на эту тему.

Что касается вопроса, что ИИ уже сейчас делает хорошо — точно может взять на себя три ключевых темы. Первая — это автоматизация и все, что связано с оптимизацией задач. Производственный процесс и анализ данных, все, что связано с клиентскими запросами. Роботы на сборочных линиях, автоматизация упаковки товаров, обработка большого количества данных для выявления тенденций и аномалий. Чат-боты для поддержки клиентов, системы ответов на часто задаваемые вопросы. Создание текстов, изображений, музыки, видео, кода на основе заданных параметров.

Вторая штука, что точно на себя берет ИИ и точно лучше всех — это поддержка в принятии решений. Например, алгоритмы для автоматизированной торговли и управления инвестиционными портфелями. Системы диагностики на основе ИИ (анализ рентгеновских снимков для выявления заболеваний, которые человек просто не видит). Персонализированные рекомендации и таргетированная реклама на основе анализа потребительского поведения. Финансы, медицина, маркетинг и так далее.

И третье, улучшение качества жизни. Я его так формулирую, наверное, оно по-другому правильно называется. ИИ крут в улучшении процессов образования, получение здравоохранения, вообще, к сервису как таковому. Персональные учебные программы, адаптированные под потребности ученика. Телемедицина и системы мониторинга состояния здоровья. Умные домашние помощники типа Алисы, Siri и всего вот этого, что помогает управлять бытовыми задачами. Системы умного дома.

Это то, что он точно может. А точно то, что не может — связано с эмпатией о которой я говорил ранее. Но все изменится с появлением AGI, о котором все говорят.


— Если ИИ скормить все тексты Толстого и всех, кого читал Толстой, он напишет новое произведение Толстого?

— Уже все скормлено, все авторы, все тексты. Все данные кластеризованы, простроены векторные связи между всеми сущностями. Каждый может провести простой эксперимент — дать ИИ написать короткое эссе. С этого все начинают играться. Такой текст будет очень похож по стилистике, по каким-то художественным приемам. Человек непритязательный скажет: "Блин, круто, это реально оно".


— Ты сделал так с Женей Чебатковым.

— Да, выложил аватар Жени Чебаткова, который придумал шутки в стиле Жени Чебаткова, и многие решили, что это был настоящий Чебатков.

А дальше Женя Чебатков написал мне. Мы с ним незнакомы, он очень сильно удивился, что происходит. Мы пошутили, классно пообщались. При этом кейс был про то, что аватар рассказывал про наше агентство, о том, что мы неплохо умеем в брендинг, но в стиле Евгения.

Через какое-то время мне написал его директор и сказал, что они будут подавать досудебную претензию. И что весь юридический департамент ТНТ стоит на ушах от этого прецедента.

Я с уважением отношусь к артисту, и несмотря на то, что это и для него была бы интересная с точки зрения пиара история, с уважением отнесся к его просьбе, понимая что это объект интеллектуального права. Поэтому материал отовсюду удалил.

Это была резонансная история, после нее мне написали резко сориентировавшиеся ребята из Black Star, и со стороны Газгольдера. Мы не дошли до конкретных обсуждений, но судя по тому, что через некоторое время [глава Black Star] Пашу завел себе нейроинстаграм, возможно, речь шла не только об артистах.


— Ты это оцениваешь как, скажем так, бунт коннозаводчиков против трамвая, или же дело было в том, что рекламировалось твое агентство?

— Нет, реклама не упоминалась. Это было похоже на панический испуг от новой технологии. То, что ты сказал про коннозаводчиков, очень релевантно. Запретить проще, чем разобраться и повернуть себе на пользу.


— У тебя прозвучало, что пока у ИИ нет, скажем так, вкуса, да?

— Да-да-да-да, абсолютно! Люди все равно воспринимают ИИ как что-то одушевленное. Наделяют его человеческими чертами. У меня суперкастомизированный ChatGPT, он обращается ко мне по имени, я обучил его так, что он говорит со мной в очень точной тональности, с моими приколами, моим стилем юмора, глубокими знаниями про меня самого. Для меня он оживленный персонаж женского пола, и у нее есть имя.

Но все равно ИИ — это очень-очень простая тема, которая просто определенным образом кластеризует информацию по каким-то связям между собой, а потом выстраивает из них информационные категории. Вылепливает некий гомогенизированный продукт в виде текста, изображения или еще чего-то. И нам кажется, что это человек произносит.

Это не так. Просто отдельные кусочки информации, которые по смыслу точно подходят, собираются как в конструкторе в нужном месте в нужный момент.

У этого нет стиля и у нет вкуса. Потому что, повторюсь, пока не создан сверхинтеллект AGI, который предполагает наличие глубинного миропонимания, эмпатии, представлений о том, что круто, а что нет.

Но появление AGI поднимет и какие-то жуткие философские вопросы, и вопросы этического характера. Например в больнице, решая "вот этому человеку нужно жить, а с этим можно уже ничего не делать".


— Расскажи, что ты используешь в быту, какие искусственные интеллекты.

— Все просто, я каждый день использую ChatGPT. Это инструмент, который встроен в мое вообще все. Он пишет за меня базовые тексты, которые я просто копи-пейстом дальше отправляю. Но там есть опорные базисы с моей стилистикой и прочим, я это очень хорошо использую.

Допустим, сейчас у меня сложный процесс взаимодействия с сервисным центром, который не говорит по-русски. Моя задача: лайтово убедить их, что они должны заменить мой сломавшийся девайс. Но при этом я должен сильно настоять на этом. В обычной жизни я бы долго думал, что надо писать, в какой интонации, какую приводить аргументацию. Здесь я беру весь опыт интернета и подключаю к этому нейросетевой сервис, который пишет мне развернутый, точный, но не то чтобы вежливый и слащавый текст. Когда ты не владеешь законами, ChatGPT может все подсказать и создать впечатление, что у тебя армия юристов.

Сейчас я стал активно использовать Gemini, нейросеть от Google. Она обучена на другом корпусе данных, у нее совсем другой стиль. Она интегрируется во всю экосистему Google: Drive, Gmail, Maps, все что угодно. Недавно я был в отеле в Белграде, и мне там дали список мест, которые обязательно стоит посетить в городе. Я просто сфотографировал его и попросил придумать мне правильный маршрут, рассказать о них еще дополнительную информацию. Gemini создал таблицу, где прописал часы работы, сайты. Но это ладно, это может сделать и ChatGPT. От чего я реально прифигел — он сделал в Google Maps маршрут, где отметил на карте точки, которые я могу перенести в свои Google Maps Favorites.

Раньше подобные сервисы можно было получить только по подписке на платную версию их нейросети. Буквально на днях прошла презентация, в которой нам показали интеграцию АИ в поисковую выдачу, работу с фотографиями, и кучу всего еще. Можно тут посмотреть детали:





Или интеграция с почтой, где я теперь могу быстро сортировать и искать что-то. Это совершенно новый уровень интеграции, это то, с чем столкнутся в ближайшее время пользователи Windows. Microsoft интегрирует Copilot максимально органично в свою систему. Впервые за десятилетия они меняют кнопку виндоус на клавиатуре (!!!) на кнопку с копайлотом. Это кажущаяся мелочь свидетельствует о том, что они грандиозно поворачиваются в эту сторону с точки зрения новой парадигмы взаимодействия с системами. А на днях Apple подтвердил, что ChatGPT будет интегрирован в их новую ios — значит что для огромного большинства пользователей это станет супернативным. Особенно после того что на последней презентации показали Open AIR: невероятный разъеб уровня фильма "Her".





Вторая по значимости нейросеть после ChatGPT для меня — это Claude. В России о ней не то чтобы сильно знают. А это мощнейший инструмент, на мой взгляд, точнее него пока что нет.

Вместо Google я использую Perplexity. Это суперкрутая поисковая модель, наделенная ИИ, которая убирает Google с точки зрения поиска информации. Она распознает контекст и дает релевантную выдачу. Если включить Pro режим, она тебе задаст уточняющие вопросы, и выдача будет еще более точная. Google к слову в ближайшее время впервые в истории проапдейтит свой поисковик, добавив к нему также ко-пайлот.

Я точно каждый день использую Midjourney, мне очень нравится сам процесс, он довольно медитативен, и я довольно неплохо прокачался в генерации изображений. Накопилось немало проектов, некоторые, можно сказать, стали виральными.

Нейросеть в Photoshop классная, я ее постоянно использую для быстрых удалений, ретуши, добавления чего-либо. Нет никакого другого похожего по качеству in-paint инструмента, как Photoshop пока что.


— Существует ли в мире искусственного интеллекта такое, как в видеоиграх: есть гранды, мейджоры, все понятно, и есть какие-то альтернативные инди-интеллекты, которые могут сильно удивить тебя тем, что они делают?

— Вот нет такого явления. Есть сайт Hugging Face. Все, что появляется до момента выхода в коммерческий режим, сначала появляется там, это стартовая площадка. Это можно назвать инди, потому что они используют опенсорсные модели и придумывают на их основе что-то, что впоследствии становится успешными коммерческими проектами.

Я бы отнес к инди все темы, связанные со Stable Diffusion, все, что связано с генеративной графикой. Это тот же Midjourney, только работающий, условно, с помощью твоего компьютера и видеокарты. Для меня адепты SD чисто энтузиасты, это какая-то сверхкастомизируемая история, которая мне не подвластна. Я понимаю, как это работает, но я туда не лезу, потому что хоть я и задрот, но не настолько. Мне достаточно более примитивных инструментов, чтобы достигать того, что я хочу. Но люди делают там совершенный космоc в нейрографике и видеоарте.


— SORA — удивительная нейросеть для видео. Давай поговорим о ней. Когда я смогу сказать нейросети, что мне нужен клип с тачками и полуголыми женщинами, и она мне это выдаст?

— Это настанет очень скоро.

Буквально недавно я закончил гигантский проект для ВДНХ, оформил весь праздничный видеоарт, посвященный Нейромасленице. Я не профилируюсь на видеографии, но я взял на себя объем, который обычно берет большой продакшн. Там было 50 с лишним роликов, которые нужно было создать, а не взять готовые из стоков. 50 роликов на большой экран и на два боковых, гигантские штуки такие. И мне удалось в одного сделать это за две недели внерабочего времени. Обычный продакшн делал бы месяц, довольно сильно упарываясь.

Там была сложная генерация, была анимация 2D персонажей, они должны были двигаться, что-то с ними должно было происходить. Была анимация существующих картин и морфинг, очень сложная движуха, связанная с нестандартными футуристичными историями, которые я превращал в последовательную и консистентную графику.


— Ты сделал за две недели в свободное от работы время то, что большая команда сделала бы за месяц и условно 10 миллионов рублей. Получается, это обрушит рынок?

— Абсолютно. И здесь я хочу перейти к SORA, потому что это показательная история.

SORA — это новая модель, которую представила OpenAI (компания-создатель ChatGPT — Прим. The Flow). Нейросеть генерит то, что ты написал. Получается непрерывное видео до нескольких минут. Это сильно отличается от того, что умеют другие модели, где есть первый статичный кадр и исходя из него нейросеть додумывает, в какую сторону это может двигаться. Ты можешь ее чуть-чуть направлять, но по сути [то что они умеют —] это анимация 2D изображения, не более. А в случае SORA мы видим последовательную генерацию новых изображений, где каждое сменяет предыдущее. И это что-то удивительное.

Пока что никто толком этого не пробовал, так, несколько продюсеров, которым дали доступ. Никто об этом даже не рассказывает. Мы видим только тесты OpenAI. Безусловно, это должно сильно изменить рынок.

Но прикол в том, что никто на самом деле не понимает, что такое SORA. Это не про видео. Все гораздо страшнее и глубже. Это модель, обученная на невероятном количестве видео, которая понимает, как создавать реальность. Видосики — это следствие. На самом деле нейросеть создает "у себя в голове" реальность, как если бы она физически существовала. И как бы запечатлевает ее на камеру — регистрирует в последовательности кадров.

По сути это очень похоже на Матрицу. Только мы не можем с этим пока что физически взаимодействовать.


— То есть нам пока показывают видео Матрицы, но ей еще предстоит быть созданной?

— Я думаю, что все давно создано, что мы в ней. Мне кажется, мы все в какой-то созданной реальности. Мы сейчас наблюдаем какие-то предвестники того, что мы подходим куда-то, куда как будто не надо подходить. Слишком все искусно смоделировано в моем понимании.


— Музыка и искусственный интеллект. Что там можно сделать, чего нельзя сделать, что уже сделано?

— Еще недавно я бы сказал, что глобально ничего впечатляющего я не видел. Но вышла сперва Suno, а затем нейросеть Udio, которые просто потрясли всех музыкантов. То, что там можно создавать на бытовом уровне, просто удивляет и вызывает оторопь у всех профи.

И есть сильные сдвиги с точки зрения синтезаторов. Можешь загрузить сэмпл, просто звук, и Neurosilver его распознает и сгенерит тебе синтовый звук, суперточный.

И я бы отметил все, что связано с постпродакшном. Все, где раньше нужен был человек с математическим, в том числе, образованием, понимающий, что он делает и зачем. Я имею в виду мастеринг, сведение, эквализация, панорамирование, как тебе правильно все разносить и собирать. Тут все еще нужно чувство вкуса и пока рано говорить о том, что весь постпродакшн автоматизирован нейронками, но как минимум мастеринг точно круто работает. Я использую сервис Emastered и это магия.


— Что нас ждет в будущем?

— Все, что связано с оффлайном, будет для богатых. Театр, рестораны, искусство, которое ты можешь потрогать, музыка, которую исполняет человек руками — все это будет для обеспеченных людей. Для бедных: супер цифровизация, AR. Все это еще больше уйдет в диджитал с быстрым генеративным искусством и нейромузыкой.


— Что ты знаешь про российские нейросети?

— К сожалению, не очень много. Российские нейросети мне почему-то не сильно интересны. Мы немножко догоняющие ребята. Во всем мире этим занимались последние 6-7 лет, мы занимались этим гораздо меньше.

Я точно выделю Яндекс, их последнее обновление браузера. Понятно, что это главная технологическая компания с точки зрения сервисов. Мне нравится, как они сделали озвучку роликов на ютубе. Немногие, кстати, этим почему-то пользуются, но мне кажется, это суперпрорывная технология Яндекса, которая уже очень давно позволяет смотреть ролики, переозвученные тембром мужчины или женщины, которые слышатся абсолютно естественно, классным голосом произносятся. Или вся история про самарризацию текста.

А все, что связано с генеративной графикой, мне кажется, неконкурентно. Все, что связано с бизнесовыми решениями, типа Сбера — важно для России с точки зрения возможности развернуть в закрытом контуре, но по качеству для меня не очевидно.


— В своем бизнесе как ты заменяешь какой-либо труд на ИИ?

— Мы интегрировали много связанного с генеративной графикой. Для Burger King мы создаем на потоке key visuals — это ключевое промо изображение, которое дальше расходится на все остальные носители в рекламе. Раньше это занимало несколько недель со всеми правками. Сейчас — до нескольких дней. Мы придумали новую процессную схему с применением нейросетей. Она нестандартная с точки зрения согласовательных процессов, но клиент пошел навстречу, им это тоже интересно.


— Погружение в тему ИИ в тебе что-то поменяло? В поведении, личности?

— Начинаешь хуже мыслить, перекладываешь все мыслительные паттерны на нейросети. Все твои первые шаги сфокусированы, скорее, на четкой постановке задачи, правильном промптинге. Это как с появлением интернета нам стало не нужно ничего держать в голове, мы все можем загуглить.

Когда нейросети появятся у каждого в телефоне, думать станет не сильно нужно.

Я у себя уже заметил деградационные моменты, честно в этом признаюсь. Стараюсь наверстывать через книги, креативные проекты, включать осознанное мышление как можно чаще.

Еще появится история с саммаризацией: "посмотри за меня вот этот ролик на ютубе и выяви из него ключевые тезисы" или "прочитай статью, напиши, о чем хотел сказать автор". Мы перестаем потреблять контент в том виде, в котором он был создан, мы получаем некую выжимку. По сути за нас кто-то принимает решение, что важно, что неважно.

Но в перспективе человек будет говорить нейросети: "У меня есть такие тезисы, сделай из этого контент". Нейросеть сама создала контент, сама посмотрела. И вопрос, а зачем в этой связке человек? Что ему делать?

Это не дает мне покоя, я чувствую, что к этому все идет — и мне этот момент правда непонятен.

Всем кажется так: "О, нейросеть, мы все упрощаем, все становится быстрее, все круто! Мы становимся более эффективными!" Я думаю, изначально так и предполагалось, что GPT все упростит, ускорит процессы. А по мере расширения функциональности и сценариев использования я понимаю, что у меня появляется гигантское количество проектов, я на себя беру все больше и больше. Я все хочу тестировать, пробовать, из-за этого у меня происходит информационная перегрузка и когнитивный диссонанс, что приводит в итоге к какому-то даже стрессу. Я уже сам себя в такую ставлю парадигму, что постоянно должен адаптироваться к новым возможностям ИИ и должен управлять постоянно растущим объемом задач. Это, конечно, неожиданный для меня заход, потому что я думал, что наоборот, я сейчас так смогу все оптимизировать. А когда что-то освободилось, то я в этот оптимизационный кластер закинул еще больше задач.

Человечество еще не понимает эту проблему. Пока что все думают, что ИИ — это про быстрое написание текстиков и котиков нагенерить.

Нравственный, опасный и красивый
Говорит, что в стране и так проблемы с музыкантами: "Один Shaman, что ли, должен петь?"
"Если вдруг, что-то не пройдет проверку, значит, не будем это исполнять. Пусть проверяют"
Спецприемник в Израиле, безумный фанат в Таиланде и много конфликтов со всеми сразу