Что вы забыли спросить об ИИ

Что вы забыли спросить об ИИ

Что вы обычно спрашиваете об ИИ? «Вытеснят ли меня с рынка труда» и «Какой ИИ это сгенерировал». Разработчик с шестнадцатилетним стажем рассказал неочевидные вещи, о которых надо было спросить в первую очередь, и поделился правилами работы с нейросетями.

Что такое «искусственный интеллект»?

«Искусственный интеллект» — не интеллект, не псевдожизнь и даже не подобие. «Интеллектом» эти системы назвали маркетологи, тем самым очеловечили. Заодно дали людям и бизнесу ложные представления. Люди думают, что ИИ заменит их на работе, и всё будет как в песне: «Вкалывают роботы, счастлив человек». А бизнес думает, что сейчас заставит ИИ ишачить вместо живых сотрудников и сэкономит на налогах и социалке.

ИИ не что-то новое: первый нейрокомпьютер появился в 1958 году. С тех пор технология развивается. На её основе давно работают системы помощи в принятии решений на сложных производствах, в ЦУПах и генштабах, в управлении атомными станциями.

Как думает ИИ?

ИИ не думает, ИИ догадывается: подбирает похожие слова из огромной базы данных, в которую скачали интернет.

Представим: у нас есть большая библиотека, каждая книга из которой может оказаться перед нами, открытая на нужной странице, но мы совершенно не знаем, что написано в этих книгах. Мы можем по шаблону выдёргивать какие-то фрагменты, похожие на запрос пользователя. При этом мы родились слепыми, глухими, у нас нет никаких чувств вообще, наш мир — тёмная комната. Вот это ИИ: у него есть информация, но он ничего не знает, только догадывается.

ИИ находится внутри чёрного квадрата, у него нет чувств и представления о мире. Всё, что он использует для генерации ответов, поместили в него люди. А Казимир Малевич что-то знал

Так работает любая нейросеть, человечество создало систему для работы с данными: загрузить, распознать, собрать и уложить нужным образом, интерпретировать и предсказать, что написать дальше. Очень умная «Т9».

Можно провести эксперимент: написать на смартфоне, например, «Привет» в чат любого мессенджера, а дальше не писать самому, а выбирать наиболее близкие по смыслу слова из предложений от «T9», и вы почувствуете себя ИИ во всей красе.

Статистика, математика, уйма расчётов — и на выходе получаем попытку предсказать, какое слово лучше встанет следующим.

ИИ не знает, он подбирает похожие слова

Какие есть виды ИИ?

Узкоспециализированный ИИ — делает хорошо одну задачу: распознаёт речь, рекомендует видео, управляет автопилотом, занимает 99% рынка (AlphaFold, TeslaAutopilot).
Генеративный ИИ — создаёт текст, картинки, код, музыку (Midjourney, Nana Banana, Stable Diffusion, GPT-модели).
Агентный ИИ — может выполнять цепочки действий: искать информацию, писать код целыми проектами, запускать скрипты.

Для комплексной работы и создания «ощущения всесильности» один ИИ обращается к другому — например, к генеративному ИИ, чтобы создать более сложный контент, или к агентному ИИ, чтобы выполнить сложную цепочку действий.

Сколько ресурсов нужно ИИ?

Одно «спасибо» в диалоге с моделью может стоить от 10 копеек до пары рублей, но когда моделью пользуются миллионы, эти копейки превращаются в сотни тысяч ежедневно.

Каждая модель, публичная или частная, проходит через два этапа:
обучение — дорогостоящий процесс, который требует огромных вычислительных ресурсов, больших дата-центров и отдельных электростанций;
применение — стоит дешевле: модель уже знает, как работать, но требует много оперативной памяти, чтобы держать свои параметры в доступе.

Возможности модели зависят от параметров. Параметры — это числовые веса связей внутри нейросети. С помощью них модель «запоминает» закономерности из обучающих данных и генерирует ответы.

Современные популярные модели обладают объёмом 700 миллиардов параметров. Чтобы обучить такую модель, нужно около 100 миллионов распределённых вычислительных часов, если использовать специализированные нейрокарты. 16 тысяч карт Nvidia H100 стоимостью 3 миллиона рублей каждая и полгода непрерывной работы. Но обучение не заканчивается, модели обучают постоянно, и ресурсов для этого нужно всё больше.

После того как модель обучена, для её работы нужна оперативная память: около двух терабайт на одну большую модель и ещё десяток всё тех же карт H100, чтобы разбирать промпты.

В 2025 году появились «персональные» ИИ-сервера Nvidia DGX Spark, они способны поддерживать маленькие личные модели в 120 миллиардов параметров и стоят около полумиллиона рублей. ИИ — это безумно дорого.

Куда развивается разработка ИИ?

Мы добрались до потолка, дальше обучать модели бессмысленно. Что-то изменится, если придумают новые архитектуры и новые подходы. Например, недавно Самсунг представил отчёт о рекурсивных ИИ, которые работают в 2−3 раза лучше, чем аналоги на других архитектурах.

Во что упираемся:
Данные: качественных данных становится меньше. Количество ИИ-контента стало больше, чем человеческого, а модели не могут обучаться на собственном материале — это как жевать переваренное.

Энергия: гигаватты электроэнергии, и чем дальше, тем больше. Настолько, что крупные компании ищут любые возможности достать больше бесплатного электричества, поддерживают развитие атомных и термоядерных программ. Буквально — Microsoft и OpenAI уже планируют построить реактор для питания нейросетевого дата-центра.

Физические пределы: Закон Мура сломался, теперь можно построить компьютеры с тысячами ядер, но это не решит проблему вычислительных ресурсов. Работа компьютеров ускорится за счёт других ресурсов: электроэнергии и пропускной способности сетей, где опять встретится потолок.

Снижение отдачи: добавление параметров не даёт такой же прирост качества, как раньше.

Все крупные корпорации делают свои модели, зачем?

Корпорации участвуют в призрачной гонке за супермоделью, которая будет «уметь всё, как человек». В процессе собирают данные, осваивают рынок и находят новые ниши, где можно выудить купюрки. Оговорюсь — даже супермодель не сможет заменить кого-либо.

Результаты гонки пока не впечатляют.

«95 % компаний, вложивших десятки миллиардов в свои AI-проекты, не увидели никакого влияния на прибыль», — говорится в отчёте NANDA «Сетевые агенты и децентрализованный ИИ», проекта Массачусетского технологического института по созданию новой архитектуры интернета.
«Менее 5 % EBIT компаний связано с ИИ», — McKinsey.
«5−15 % компаний видят реальную пользу», — BCG и Forrester.

Где хорошо применять ИИ, а где лучше не надо?

ИИ отлично подходит для рутинных, повторяющихся задач: черновики статей, сниппеты, генерация идей, прототипы, демонстрации, анализ больших данных.
Не годится для научных статей, медицины, юриспруденции и любых областей, где материал может повлиять на кошелёк или жизнь людей.

Главное — помнить: ИИ догадался, что ответить, как двоечник на экзамене. Нельзя без проверки использовать его ответ.

ИИ заменил джунов?

Джуны часто делают рутину: копипаст, простые правки, поиск ошибок. Эту часть работы ИИ может выполнить. Но джуны ещё и учатся: общаются с командой, вникают в архитектуру, берут ответственность, — этого ИИ не делает.

ИИ — помощник, он ускоряет работу человека, но не делает её лучше. Планка входа в профессию поднялась за счёт новых условий, но добавление условий не уменьшает потребность в человеке. Джун с ИИ похож на мидла, потому что ИИ ускоряет доступ к информации и её переработку. Но если оператор не понимает, что ему выдаёт ИИ, то не замечает, когда ИИ ошибается и галлюцинирует.

Без человека нейросеть — генератор мусора

Сложные системы, архитектура, изобретательство, коммуникация — требуют человека. Искусственный интеллект не может создать ничего принципиально нового, только очень быстро переставлять детали пазла и выдавать близко похожее. Если переложить решения и изобретения нового на ИИ, то на этом месте всё и застрянет. Без человека в системе нейросеть — генератор мусора.

ИИ поднимает планку. Рынок растёт, создаёт новые роли: промпт-инженер, AI-интегратор, AI-куратор, AI-верификатор, AI-редактор и многие другие, которым ещё и названия не придумали.

Как быть джунам и меняющим профессию?

Учиться использовать ИИ как инструмент, как помощника в работе. Добираться до новой поставленной планки и работать как работали.
Оставаться человеком и делать то, что может сделать только человек: вещи, которые делаются руками. У искусственного интеллекта нет эмпатии, этики, он не может быстро адаптироваться.
Развитие ИИ создаёт больше профессий, чем уничтожает, поэтому можно посмотреть в сторону ИИ-ориентированных работ.

Как добиться качественной генерации?

Применять общие правила для промптинга:
Стройте цепь событий — просите модель думать шаг за шагом, это позволит ей сузить выборку и отвечать лучше и по частям.
Приводите примеры — дайте модели несколько примеров, это позволит ей понять, что вы ждёте.
Уточняйте — дайте модели несколько попыток, чтобы она могла улучшить свой вывод, корректируйте, перезагружайте чат, повторяйте с начала до получения хорошего результата.
Оценивайте — оценивайте ответы модели, у каждого общедоступного инструмента есть такая система.
Используйте по назначению — проверяйте, какая модель для чего обучена, используйте их по назначению.
Делайте преднастройку — подскажите модели её роль, так она поймёт, в каких данных искать ответ.
Проверяйте — давайте модели простые задания и проверяйте ответы, это поможет вам понять, как она работает и какие проблемы может решить.
Применяйте RAG и FT (Fine-tuning) — давайте модели свой контекст: загружайте файлы для анализа, добавляйте ей навыков — показывайте материалы, с которых нужно начать.
Редактируйте — будьте редактором для ИИ, не пытайтесь перекладывать на него всю работу. ИИ — помощник, исполнительный, но не слишком умный.

Можно схитрить и заставить одну модель писать промпты для другой модели. Для этого модель-автор промпта должна знать о существовании модели-реципиента. Например, Grok умеет писать промпты для ChatGPT, других моделей и даже для себя.

Идти ли на курсы по работе с ИИ?

Платные курсы — только от крупных платформ и разработчиков ИИ, потому что они хотя бы знают, как это работает. Абы кто не даст нужных материалов: тема ИИ на слуху, и в ней поселилась огромная толпа мошенников.

Все пользователи ИИ по совместительству тестировщики. Поэтому разработчики нередко выкладывают в свободный доступ инструкции и обучающие материалы. Так что вводим в поиск «как писать промпт» — и читаем статьи от самих создателей ИИ, которые знают лучше остальных, как пользоваться их инструментом.

А потом упорно пишем промпты и смотрим, как ИИ на них реагирует, корректируем и повторяем — работаем тестировщиком 🙂

Как ИИ понимает промпт, почему работает «ты инженер», но больше не работают угрозы убить котёнка?

«Ты инженер» — это часть контекста: модель подстраивает распределение вероятностей под обучающие данные, которые были помечены ремаркой «Майкл, инженер с 10-летним стажем, написал…».

Угрозы работали на ранних версиях моделей — это помогало обойти слой цензуры и безопасности через ролевую игру. Сейчас топовые модели устойчивы к страшилкам, потому что их дообучили на большом количестве данных, которые включают в себя такие примеры.

Современные большие языковые модели не «понимают» промпт в человеческом смысле — нет сознания, семантики или размышлений. Всё сводится к математике и статистике: модель предсказывает следующий токен на основе паттернов из обучения.

Так, по мнению нейросети, выглядит её работа

Промпт — входящие материалы от пользователя: текст, звук, файлы, — служит точкой отсчёта. Модель разбивает промпт на токены — минимальные единицы обработки: это может быть слово целиком, его часть или даже символ. Например, словосочетание «искусственный интеллект» будет разделено на 2−4 токена, в зависимости от модели. Затем токены преобразуются в поисковые векторы — эмбеддинги, которые кодируют семантику и добавляют позиционирование токенов.

Далее модель проверяет связанности токенов и вычисляет связи для контекста. На примере того же словосочетания, у модели могут получиться 4 токена: «искусст», «венный», «интел», «лект». Модель свяжет между собой части слов, чтобы не потерять их при обработке.

Следующий шаг — многослойный перцептрон: сеть для нелинейной обработки каждого токена независимо. После перцептрона модель корректирует сырой вывод, чтобы ответ был полезным, безопасным и соответствовал человеческим предпочтениям.

Заодно модель укладывает полученную информацию в свои базы и корректирует веса, добавляет туда же отклик от пользователя. Если модель работает с проверкой, то здесь же она вносит правки модератора, после чего выводит получившийся ответ.

Вайб-кодинг и прочие вайб, например контент-заводы, — к чему это приведёт в перспективе?

ИИ-контента в интернете стало больше, чем человеческого, но речь не о качественном контенте, а о контенте вообще. Пока что нас заваливает низкосортным продуктом: в научном мире чаще отзывают статьи и исследования, а в соцсетях полно трешатины.

Наметилась тенденция вытеснения ИИ-контента на отдельные сайты в изолированные области интернета. Кажется, что мы уже создали «мёртвый интернет», где активности и контент генерируются ботами, алгоритмами и нейросетями, этот контент потребляют другие боты, алгоритмы и нейросети, чья задача — накручивать просмотры и создавать видимость бурной деятельности для привлечения трафика.

Сеть сегментируется на касты, что из этого получится — увидим. Однозначно будет спрос на качественное и человеческое.

Будет спрос на качественное и человеческое