Будущее ИИ: транзисторы вместо моделирования нейронных сетей

Поддержите независимые СМИ в России, поддержите «Октагон».

«Попытка создания аналога мозга человека на базе современных суперкомпьютеров – это путь в никуда», – считает академик РАН, специалист по многопроцессорным и управляющим системам Игорь Каляев. По его мнению, гораздо более перспективными являются нейроморфные технологии, в которых обработка информации основана на принципах, присущих человеческому мозгу, а программное моделирование частично заменено аппаратно-архитектурными решениями на принципиально иной электронно-компонентной базе.

Такая технология искусственного интеллекта (ИИ) разрабатывается в рамках одной из программ Национального центра физики и математики (НЦФМ), созданном три года назад по решению Правительства РФ на территории технопарка «Саров» в Нижегородской области. Суть идеи – в объединении нейроморфных принципов, которые позволят на порядок повысить производительность суперкомпьютерных вычислений, с соответствующим образом адаптированной архитектурой компьютерных систем.

Мифология ИИ и нейронных сетей

Задача воссоздания работы нервных клеток живого организма, то есть создания искусственной нейронной сети (ИНС) с помощью компьютера сформулирована на стыке нейрофизиологии и кибернетики в середине 60-х годов прошлого века – через 10 лет после появления понятия «искусственный интеллект». ИНС – система взаимодействующих между собой простых (имеющих дело с определёнными сигналами) процессоров или программных блоков.

Главным преимуществом ИНС в сравнении с традиционными алгоритмами считается возможность обучения, то есть нахождение коэффициентов связи между нейронами. Это позволяет выявлять сложные зависимости между входными и выходными данными и делать некоторые новые обобщения. Подобные модели уже создаются, но все они носят узкий, прикладной характер.

Ни о каком самообучающемся с помощью нейронных сетей ИИ, который начнёт решать проблемы лучше и быстрее людей, речь пока не идёт. Модели, воспроизводящие функционирование человеческого мозга, работают в сотни раз медленнее, чем он, и оказываются слишком затратными технологически и энергетически.

Четыре года назад на самом быстром на тот момент суперкомпьютере Sunway Taihulight мощностью 1017 флопс (флопс – единица измерения производительности компьютера, показывающая, сколько операций он способен совершать в секунду) была смоделирована секундная активность одного процента человеческого мозга. На это потребовалось около четырёх минут. По итогам эксперимента было подсчитано, что для моделирования работы ста процентов человеческого мозга потребуется суперкомпьютер с производительностью 1020–1021 флопс, то есть в тысячу или 10 тысяч более мощный, чем Sunway Taihulight. Потреблять он будет порядка 15 гигаватт электроэнергии, а размером он должен быть с 17-этажный дом с основанием 300 на 300 метров.

Суперкомпьютер Sunway TaihuLight в Национальном компьютерном центре на востоке Китая.Фото: Chinatopix/AP/TASS

Человеческий мозг потребляет 15–20 ватт, его объём равен 0,0015 кубометра, а попытка воспроизвести его работу с помощью программ и железа потребует в миллиард раз больше энергии, и займёт в три миллиарда больший объём. Но главное отличие состоит в том, что компьютерные модели, в том числе самообучающиеся ИНС, работают в соответствии с заложенными в них алгоритмами. В отличие от людей они не способны ни поставить принципиально новую задачу, ни найти оригинальное решение.

Скептически относящийся к рекламируемым в последнее время успехам ИИ академик Каляев говорит, что «большинство достижений искусственного интеллекта связано не с совершенствованием алгоритмов обучения, хотя они тоже имеют значение, а с ростом мощности суперкомпьютеров», состоящих из сотен тысяч параллельно работающих процессоров.

Гонка суперкомпьютеров не может длиться вечно

По словам Каляева, высокая скорость «позволяет суперкомпьютерам за ограниченный промежуток времени перебирать огромное количество вариантов на много шагов вперёд» и выполнять большие объёмы вычислений. Это касается задач установления связей, поиска, систематизации, логического вывода и других заложенных в компьютерные программы алгоритмов, которые построены на жёсткой последовательности заданных человеком действий.

Вторая важная характеристика ИИ – способность оперировать большими массивами информации. Большая языковая модель ChatGPT3 «знает» (имеет возможность быстро найти и использовать) 420 Гб текста.

Чтобы просто ознакомиться с таким объёмом, человеку нужно круглосуточно читать по одной странице в минуту в течение 31,3 млн лет.

Два эти качества – объём доступной в режиме реального времени информации и скорость, помноженные на развитие микроэлектроники, создали предпосылки для быстрого развития современных суперкомпьютеров на кремниевой элементной базе. С технологической точки зрения, их мощность напрямую зависит от числа транзисторов, размещённых на кристалле микропроцессора. Каждые два года этот показатель удваивается (закон Гордона Мура). Соответствующим образом растёт и производительность суперкомпьютеров.

Россия тоже участвует в этой гонке, но существенно отстаёт от США, Китая и ряда других стран. По состоянию на июнь этого года в списке топ-500 наиболее производительных суперкомпьютеров фигурируют 171 американский, 80 китайских, 40 немецких, 29 японских и только семь российских. При этом мощность самого производительного из российских суперкомпьютеров («Червоненкис», созданный компанией «Яндекс») в 80 раз ниже, чем у занимающего первое место американского Frontier (OLCF-5). Главная причина этого отставания – отсутствие в России технологических линеек по производству современной микроэлектронной элементной базы.

Российская микроэлектроника отстаёт от мировой на несколько лет.Фото: Sebastian Kahnert/DPA/TASS

В то же время, как отметил в одном из последних интервью академик Каляев, процесс наращивания мощности суперкомпьютеров «начинает подходить к своему технологическому и физическому пределу». Это связано с нарастающими сложностями охлаждения элементной базы, которая всё сильнее перегревается во время работы суперкомпьютеров, а также с достижением предельных показателей плотности размещения транзисторов и частоты переключения кремниевого логического элемента.

В результате сегодня на первый план выходит задача создания компьютеров на принципиально иной физической основе: квантовой и фотонной. Одновременно актуализируется вопрос о новых подходах к использованию огромного парка имеющихся кремниевых компьютеров и суперкомпьютеров.

Альтернативные идеи российских специалистов

Подход, который пропагандирует академик Каляев, является альтернативой простому наращиванию вычислительных мощностей. Он подразумевает «поиск принципиально новых способов обработки информации, изобретение вычислительных устройств, работающих на принципах, присущих мозгу человека».

В частности, для эффективного решения разнородных прикладных задач, предлагается использовать не один мощный суперкомпьютер, а гетерогенную (неоднородную) инфраструктуру, состоящую из суперкомпьютеров различных классов и архитектур. А управлять ею должен интеллектуальный диспетчер, определяющий, на каком из суперкомпьютеров конкретная задача может быть решена наиболее эффективно.

Эта идея была заложена в Концепцию создания и развития национальной суперкомпьютерной инфраструктуры (НСИ), одобренную советом по приоритетным направлениям научно-технологического развития при НЦФМ в мае 2019 года. Но никаких решений на этот счёт до сих пор не принято. Документ шестой год находится на рассмотрении в различных инстанциях.

Вторая продвигаемая Каляевым идея касается аппаратной реализации фрагментов связи внутри искусственных нейронных сетей, имитирующих работу человеческого мозга (нейроморфный подход). С технологической точки зрения речь идёт о замене математической модели обмена импульсами между элементами ИНС на мемристоры – транзисторы, запоминающие размер электрического заряда и сохраняющие эту информацию в виде своего сопротивления. Этот механизм является аналогом функционирования физиологического синапса – места контакта между нервными клетками.

Академик РАН Игорь Каляев предлагает использовать принципиально новые способы обработки информации.Фото: Александр Щербак/ТАСС

По словам Каляева, «технология должна стать основой для создания энергоэффективного аппаратного обеспечения алгоритмов машинного обучения и алгоритмов импульсных нейронных сетей». В среднесрочной перспективе она позволит перейти к созданию специализированных аппаратных средств, обеспечивающих качественно новые характеристики систем принятия решений и управления сложными объектами критической инфраструктуры.

Кроме того, мемристорные устройства создают предпосылки для перехода к гибридному интеллекту – системам, объединяющим искусственные и естественные нейронные сети. Это, по утверждению Каляева, «открывает путь к реализации компактных и энергоэффективных адаптивных систем для нейропротезирования – замещения и восстановления утраченных функций мозга и нервной системы человека.

Последняя новация настораживает своей близостью к идеям трансгуманизма. Тем не менее предложение заменить энергозатратное моделирование работы нейронной сети аппаратными и архитектурными конструкциями выглядит вполне революционно. Но что стоит за её продвижением – попытка компенсировать отставание России в гонке суперкомпьютеров, борьба разных подходов к развитию ИИ, попытка получить финансирование под перспективный проект или реальный прорыв в компьютерных технологиях – пока непонятно.

Будущее ИИ: транзисторы вместо моделирования нейронных сетей

Мифология ИИ и нейронных сетей

Гонка суперкомпьютеров не может длиться вечно

Альтернативные идеи российских специалистов

Читайте также