2024/11/02 10:02:34

Нейросети
Нейронные сети
Нейротехнологии

Нейросети – одно из направлений искусственного интеллекта, цель которого – смоделировать аналитические механизмы, осуществляемые человеческим мозгом. Задачи, которые решает типичная нейросеть – классификация, предсказание и распознавание.

Содержание

Безопасность нейросетей
- 2022: ИИ может ошибаться даже при незаметных модификациях данных
Нейронные сети и байесовские модели
Нейросети для создания картинок
Как использовать нейросети
Нейросети в России
Нейросети в мире
Как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей
Homo ex machina: переносим сознание в компьютер
Графовые нейросети: мимолетный тренд или за ними будущее
Робототехника
Примечания

Основная статья: Машинное обучение (Machine Learning)

Нейросети способны самостоятельно обучаться и развиваться, строя свой опыт на совершенных ошибках. Анализируя и обрабатывая информацию из какого-то конкретного источника, либо из сети Интернет в целом, самоорганизующаяся система способна создавать новые продукты, не только воспроизводя и структурируя вводные данные, но и формируя качественно иной результат, ранее недоступный искусственному интеллекту.

Нейронет (NeuroNet) – один из предполагаемых и наиболее вероятных этапов развития Интернета. На новом этапе развития всемирной паутины взаимодействие участников будет осуществляться на принципах нейрокоммуникаций, т.е. на основе передачи информации об активности головного мозга. Ученые прогнозируют формирование рынка Нейронета к 2030-2040 г. Причем, ожидается, что в это время на рынке уже будут функционировать не менее 10 российских компаний с общей капитализацией около 700 млрд рублей.

Безопасность нейросетей

2022: ИИ может ошибаться даже при незаметных модификациях данных

Специалисты компании «Криптонит» провели масштабное исследование безопасности искусственных нейросетей, повсеместно применяемых в системах компьютерного зрения, распознавания речи и глубокого анализа различных данных, включая финансовые и медицинские. Об этом компания сообщила 29 ноября 2022 года.

Эксперты сравнили описанные в научных статьях атаки на модели машинного обучения (ML), построенные на основе искусственных нейронных сетей (ИНС), воспроизвели разные реализации атак и рассказали про 10 самых наглядных.Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг

В своём исследовании авторы использовали три общепринятых в информационной безопасности сценария:

атака типа white-box предполагает наличие полного доступа к ресурсам сети и наборам данных: знание архитектуры сети, знание всего набора параметров сети, полного доступа к обучающим и тестовым данным;
атака типа gray-box характеризуется наличием у атакующего информации об архитектуре сети. Дополнительно он может обладать ограниченным доступом к данным. Именно атаки по типу «серого ящика» чаще всего встречаются на практике.
атака типа black-box характеризуется полным отсутствием информации об устройстве сети или наборе обучающих данных. При этом, как правило, неявно предполагается наличие неограниченного доступа к модели, то есть имеется доступ к неограниченному количеству пар «исследуемая модель» + «произвольный набор входных данных».

Были протестированы различные библиотеки для создания вредоносных примеров. Изначально были отобраны AdvBox, ART, Foolbox, DeepRobust. Производительность AdvBox оказалась очень низкой, а DeepRobust на момент исследования была очень сырой, поэтому в сухом остатке оказались ART и Foolbox. Эксперименты проводились на различных типах моделей ML. В своем отчете «Криптонит» поделился самыми наглядными результатами, полученными с использованием одной фиксированной модели на основе свёрточной нейронной сети и пяти различных атак. Их реализации взяты из двух библиотек.

Для демонстрации использовалась база данных MNIST, которая содержит 60 000 образцов рукописных цифр, и отобрали самые наглядные вредоносные примеры.

Число сверху – абсолютная величина максимального отклонения возмущения от оригинала. Под изображением три числа: максимальное отклонение, минимальное и среднее. В нижней строке – метка и вероятность.

Исследование показало, что проблема с безопасностью моделей ML, основанных на нейросетях, действительно есть. Нейросеть может «с уверенностью» выдать некорректный результат при совсем небольших изменениях в картинке или других входных данных — настолько незначительных, что человек их вряд ли заметит.

Так, картинка слева — исходный пример, в котором нейросеть уверенно распознаёт цифру «4». Посередине — неудачный вредоносный пример. Изображение заметно искажено, однако нейросеть всё равно распознаёт четвёрку. Справа — работающий вредоносный пример. Он визуально неотличим от предыдущего, но здесь уже преодолён порог возмущений, за которым нейросеть теряется и выдаёт неверный результат распознавания. В данном случае вместо «4» она распознаёт «7». В примере выше человек уверенно различает цифру «4» на любой из трёх картинок, но исходные изображения не всегда бывают достаточно чёткими.

Например, на следующей картинке недописанный ноль может зрительно восприниматься как цифра «6» — вопрос в том, куда мысленно продолжить линию. Нейросеть тоже не уверена: она показывает низкую вероятность, но правильно распознаёт ноль на изображении. Чтобы заставить ИНС ошибиться, нужно изменить всего несколько пикселей. При этом величина вносимого возмущения будет порядка 1/256, что соответствует величине цветового разрешения.

Нейросеть далеко не всегда удаётся обмануть так просто. В случае уверенного распознавания объекта придётся сгенерировать и проверить множество вредоносных примеров, прежде чем удастся найти рабочий. При этом он может быть практически бесполезным, так как вносит слишком сильные возмущения, заметные невооружённым глазом.

Для иллюстрации в «Криптонит» взали наиболее легко распознаваемую цифру «9» из тестового набора и показали некоторые получившиеся вредоносные примеры. На иллюстрации видно, что в 8 случаях из 12 построить вредоносные примеры не удалось. В остальных четырёх случаях исследователи обманули нейросеть, но эти примеры получились слишком зашумлёнными. Такой результат связан с уверенностью модели в классификации исходного примера и со значениями параметров различных методов.

В целом эксперимент показал ожидаемые результаты^[1]: чем проще изменения, которые вносятся в изображение, тем меньше они влияют на работу ИНС. Следует подчеркнуть, что «простота» вносимых изменений относительна: это может быть и десяток пикселей, но вот догадаться, каких именно, и как их нужно изменить — сложная задача. Нет такого гвоздя, на котором полностью держится результат классификации CNN: в общем случае нельзя изменить один пиксель так, чтобы ИНС ошиблась.

Методы PGD, BIM, FGSM, CW, DeepFool оказались самыми эффективными для сценария «белый ящик». Вне зависимости от реализации, они позволяют провести удачную атаку с вероятностью 100%, однако их применение подразумевает наличие полной информации о модели ML.

Методы Square Attack, HopSkipJump, Few-Pixel, Spatial Transformation предполагают наличие информации об архитектуре модели. Были получены единичные удачные примеры атак, но практическое использование этих методов не представляется возможным. Возможно, ситуация изменится в будущем, если появятся достаточно эффективные реализации, стимулирующие интерес исследователей к этим методам.

Все рассмотренные методы «чёрного ящика» используют уровень достоверности, возвращаемый нейронной сетью. Если хотя бы немного понизить точность возвращаемого уровня достоверности, то (и без того невысокая) эффективность методов упадёт многократно.

Нейронные сети и байесовские модели

Две популярные парадигмы в области машинного обучения. Первые совершили настоящую революцию в области обработки больших объемов данных, дав начало новому направлению, получившему название глубинное обучение. Вторые традиционно применялись для обработки малых данных. Математический аппарат, разработанный в 2010 годы, позволяет конструировать масштабируемые байесовские модели. Это дает возможность применить механизмы байесовского вывода в современных нейронных сетях. Даже первые попытки построения гибридных нейробайесовских моделей приводят к неожиданным и интересным результатам. Например, благодаря использованию байесовского вывода в нейронных сетях удается сжать сеть приблизительно в 100 раз без потери точности ее работы.

Нейробайесовский подход потенциально может решить ряд открытых проблем в глубинном обучении: возможность катастрофического переобучения на шумы в данных, самоуверенность нейронной сети даже в ошибочных предсказаниях, неинтерпретируемость процесса принятия решения, уязвимость к враждебным атакам (adversarial attacks). Все эти проблемы осознаются научным сообществом, над их решением работают многие коллективы по всей планете, но готовых ответов пока нет.

Нейросети для создания картинок

Основная статья: Нейросети для создания картинок

Как использовать нейросети

В мире созданы нейронные сети, способные рисовать картины в любом существующем художественном стиле, уверенно обыгрывать чемпиона мира в самую сложную логическую игру на планете, записывать музыкальные альбомы и подражать поведению человека в электронной переписке. Всё перечисленное – пока лишь демонстрация части возможностей технологии, реальное применение которой как в бизнесе, так и в быту, мы увидим в ближайшем будущем.

Другими словами, нейронные сети позволят не только и не столько заменить человеческий труд в более сложных трудовых активностях, сколько стать полезным инструментом для специалистов и управленцев множества областей.

Влад Шершульский, Директор по перспективным технологиям, Microsoft Rus комментирует: «Эта область окончательно стала в 2016 году «горячей»: примерно с 2009 года наблюдается быстрый прогресс в создании все более сложных, и при этом все более эффективных, глубоких нейронных сетей, а в самое последнее время мы увидели впечатляю щие приложения и стали свидетелями создания целого ряда успешных стартапов. Порог входа на рынок нейросетевых сервисов существенно снизился, а проекты, построенные вокруг идеи одного интересного приложения, реализуются за считаные месяцы. Все это породило бум нейросетевых стартапов, вызвало интерес крупных корпораций и способствовало росту спроса на специалистов в этой области, в том числе и в России. Приятно отметить, что важнейший вклад в создание нового поколения технологий работы с естественными языками внесли специалисты компании Microsoft. В известном телевизионном сериале «Звездный путь» создание онлайнового перевод чика устной речи прогнозировали в XXII веке, а он у нас уже есть сегодня. Конечно, другие применения – от прогнозирования поломок автомобилей и банкротства контрагентов до новых средств кибербезопасности – тоже развиваются весьма успешно».

Нейросети в радиологии

Основная статья: Искусственный интеллект в медицине

Нейросети в СМИ

2023: Какие нейросети уже сегодня можно использовать в СМИ

Сегодня все больше людей понимают, что за нейросетями будущее, и что на них можно делать вещи, которые раньше были невозможны. Как и любой инновационный продукт - широкой аудитории нейросети кажутся чем-то малоприменимым, но любопытным. Они умеют писать музыку, обрабатывать и генерировать изображения, выделять главное, озвучивать текст, поддерживать несложный диалог. Но после первого восторга все наиграются, и новинка станет рабочей обыденностью во всех сферах. Например, специально для СМИ было отобрано несколько способов потенциального применения нейросетей для решения реальных задач.

В статье «Медиа будущего: какие нейросети уже сегодня можно использовать в СМИ» представлены результаты исследования экспертов, которые, опираясь на свой многолетний опыт работы в онлайн-СМИ, проанализировали: что могло бы упростить журналистам работу, улучшить качество материалов и повысить эффективность бизнеса. Подробнее здесь.

Нейросети для работы PR-специалиста

ChatGPT для YouTube - поможет быстро транскрибировать видеоролики с YouTube.
Perplexity AI - умный поисковик информации, который поможет найти нужные данные в море информационного шума.
Stable Diffusion обеспечивает работу с текстом, транскрипцией, переводом, а также с YouTube.
Writesonic генерирует тексты на основе актуальной информации из сети.
300.ya.ru предлагает выжимку тезисов из различного видео контента.
Gerwin AI поможет с генерацией постов для российских социальных сетей.
DeepL - прекрасный инструмент для работы с текстами на иностранных языках.
Gamma - инструмент для создания интерактивных и креативных презентаций.
@smartspeech_sber_bot - возможность для расшифровки аудиосообщений в Telegram.

Нейросети в сфере продаж

2024: 5 этапов воронки продаж, в которые можно (и нужно) внедрить нейросеть

Со всех сторон сыпятся отчёты, сколько компаний уже используют ИИ (искусственный интеллект; он же обычно подразумевается под AI, нейросетями и ML-моделями) и какие отрасли – самые передовые.

Эта статья рассмотрит применение нейросетей, встроенных в CRM, коммерческими департаментами. За "контрольные точки" будут взяты пять классических этапов воронки продаж, которые есть в абсолютно любом бизнесе: маленьком и большом, b2c и b2b, узконаправленном и для широкой аудитории, эконом и luxury. Подробнее читайте здесь.

Нейросети в России

В России разработками в области нейросетевого программирования занимаются крупнейшие интернет-холдинги, в частности, VK (ранее Mail.ru Group) и Яндекс, используя нейросети для анализа изображений и обработки текстов в поисковике. Самыми знаменитыми примерами стали технологии компаний Microsoft, Google, IBM и Facebook, а также стартапы MSQRD, Prisma^[2].

2024

Российские ученые создали нейросети для обнаружения сгенерированных ИИ вставок в научных текстах

Команда исследователей с участием Александра Ширнина из НИУ ВШЭ создала две модели для обнаружения в научных текстах частей, сгенерированных искусственным интеллектом. В системе AIpom соединены два типа моделей — декодер и энкодер, что позволяет ей эффективнее находить сгенерированные вставки. Система Papilusion подходит для распознания исправлений с помощью синонимов и кратких пересказов, сгенерированных нейросетью, в работе она использует модели одного типа — энкодеры. В перспективе подобные модели помогут в проверке оригинальности и достоверности научных публикаций. Об этом НИУ ВШЭ сообщила 6 декабря 2024 года. Подробнее здесь.

SteadyControl запатентовал метод непрерывного дообучения нейросетей для бизнеса

«Евразийская патентная организация» подтвердила исключительное право SteadyControl на метод непрерывного дообучения нейросетей для бизнеса. Решение подразумевает непрерывное дообучение нейросетей: эксперты повышают точность ИИ для качественного анализа бизнес-процессов. Патент действует на территории России и 7 государств ближнего зарубежья. Об этом компания сообщила 4 декабря 2024 года. Подробнее здесь.

Российские ученые создали «сомневающуюся» нейросеть, способную распознавать неизвестные объекты

Студенты Университета МИСИС и МФТИ совместно с учеными некоммерческой лаборатории исследований искусственного интеллекта T-Bank AI Research предложили ансамблевую нейросеть SDDE (Saliency Diversified Deep Ensembles), которая с большей точностью определяет объекты на изображениях, не загруженных в базы данных. Об этом МИСИС сообщил 31 октября 2024 года. Подробнее здесь.

В России создана технология, которая позволяет сократить время обучения нейросетей в 15-20 раз

9 сентября 2024 года компания Cognitive Pilot сообщила о разработке технологии, позволяющей автоматически исправлять ошибки нейронных сетей и оптимизировать эффективность обучения до 40%. Разработанную технологию в компании в шутку назвали Cognitive Neural Network Hospital, за ее способность «вылечивать больные места» нейронной сети. Например, при добавлении в обучающую выборку новых данных по дорожным светофорам, благодаря Cognitive Neural Network Hospital точность распознавания удалось оптимизировать сразу с 99,3% до 99,99%. Технология также позволяет сократить время обучения (с учетом отбора данных) в 15 – 20 раз. Подробнее здесь.

Обучение с подкреплением позволило лучше работать генеративным потоковым нейросетям

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ применили классические алгоритмы обучения с подкреплением для настройки генеративных потоковых сетей (GFlowNets). Это позволило улучшить работу GFlowNets, которые применяются уже три года для решения сложнейших научных задач на этапах моделирования, генерации гипотез и экспериментального проектирования. Об этом НИУ ВШЭ сообщила 13 июня 2024 года.

Устройство GFlowNets можно описать на примере конструктора лего: по недостроенному объекту и набору доступных деталей модель будет пытаться предсказать, в какое место и с какой вероятностью нужно добавить деталь, чтобы по итогу мы могли с большой вероятностью собрать хороший макет машины или корабля, - сказал Никита Морозов, Стажер-исследователь Центра глубинного обучения и байесовских методов Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Обучение с подкреплением (Reinforcement Learning, RL) — одна из парадигм машинного обучения, в которой агент обучается взаимодействовать со средой с целью максимизации функции награды. Классическая модель, построенная на основе обучения с подкреплением, AlphaGo, — программа, победившая в настольную игру го профессионального игрока.

Генеративные потоковые сети и обучение с подкреплением схожи тем, что в качестве обучающего сигнала получают функцию награды. Однако GFlowNets пытается не максимизировать награду, а обучиться генерировать объекты с вероятностями, пропорциональными награде.

Ученые Центра ИИ и Института искусственного интеллекта и цифровых наук факультета компьютерных наук НИУ ВШЭ показали, что задача обучения генеративных потоковых сетей максимально схожа с общей задачей обучения с подкреплением, а также применили специализированные методы обучения с подкреплением для генерации дискретных объектов, например молекулярных графов.

Мы показали, что классические алгоритмы обучения с подкреплением применительно к GFlowNets работают сравнимо и даже эффективнее известных современных подходов, разработанных специально для обучения этих моделей. Так, в рамках задачи моделирования молекул лекарств с заданными свойствами за время обучения нашего метода было сгенерировано на 30% больше высококачественных молекул, чем у существующих методов, - отметил Алексей Наумов, научный руководитель Центра ИИ, директор по фундаментальным исследованиям Института искусственного интеллекта и цифровых наук ФКН НИУ ВШЭ.

Исследователи подчеркивают, что использование существующих методов обучения с подкреплением для обучения GFlowNet напрямую, без дополнительной адаптации этих методов, позволит ускорить прогресс развития новых методов в медицинской химии, материаловедении, энергетике, биотехнологиях и во многих других областях, где GFlowNet нашли применение за три года существования.

Исследование поддержано грантом для исследовательских центров в области искусственного интеллекта, предоставленным Аналитическим центром при Правительстве РФ.

Ученые научили искусственный интеллект обрабатывать последовательности длиной в два миллиона токенов

Группа российских ученых из Московского физико-технического института, Института искусственного интеллекта AIRI и Лондонского института математических наук предложила метод для обработки больших данных. Он позволяет искусственному интеллекту генерировать ответы на вопросы объемом до 2 миллионов токенов. Об этом МФТИ сообщил 31 мая 2024 года.

Предложенный метод основан на особом механизме использования языковых моделей (алгоритмов для предсказания слова, знака или фразы на основе контекста). Такие модели лежат в основе современных диалоговых систем, поисковых сервисов и голосовых помощников.

При этом их программную часть составляют трансформеры — универсальные архитектуры, которые помогают выстроить правильный порядок действий при обработке запроса и генерации ответа. В частности, трансформеры позволяют нейросетям выполнять множество задач одновременно, что ускоряет их работу.

Однако модели, которые используют стандартные трансформеры, не могут обрабатывать длинные тексты. Их скорость быстро падает, когда размер текста увеличивается. В результате нейросети приходят к пределам возможностей, выдают «галлюцинации» или ошибочные ответы, — объяснил проблему один из авторов научной работы, программист-разработчик лаборатории нейронных систем и глубокого обучения МФТИ Айдар Булатов.

По его словам, чтобы обойти преграду, команда исследователей предложила добавить трансформерам «механизм памяти». Суть идеи в том, чтобы разделить длинные входные последовательности на сегменты и снабдить их дополнительными алгоритмами для резервирования информации. Эти элементы служат как бы «мостиками», по которым важные данные переносятся с предыдущего сегмента на следующий. Это позволяет языковой модели держать в «памяти» весь длинный текст на всем его протяжении. На следующем этапе программа уже может выполнять с «усвоенным» текстом различные операции, обрабатывая информацию в соответствии с запросами пользователей.

Сначала мы проводили эксперименты на небольших последовательностях — от 7 до 15 сегментов, в каждом из которых по 500 токенов (базовых единиц информации в языковых моделях), но заметили, что качество обработки данных при увеличении длины не падает. Тогда мы продолжили тестирование модели и дошли до миллиона, а затем — и до двух миллионов токенов. Для сравнения это объем всех книг о Гарри Поттере, — объяснил со своей стороны соавтор работы, научный сотрудник AIRI Юрий Куратов.

В ходе работы ученые также исследовали «интеллектуальные» способности модели, задавая ей задачи на обнаружение в длинных текстах нужных данных, на их запоминание и на «рассуждения» на основе усвоенного. При этом программа продемонстрировала не только способности удерживать в «памяти» массивы информации, но и навыки «критического мышления» и «писательского мастерства».

В дальнейшем, по мнению авторов работы, предложенный метод будет востребован для разработки быстрых нейросетевых алгоритмов для обработки больших баз данных. Например, для быстрого перевода книг, чтения программного кода, изучения геномных последовательностей или предсказания новых материалов.

В России нашли способ повысить эффективность работы нейросетей на 40%

Ученые Smart Engines нашли способ повысить эффективность работы нейросетей. В основе метода лежит принципиально новая схема квантования, благодаря которой скорость работы повышается на 40%. Результаты исследования были опубликованы в журнале Mathematics (Q1). Об этом Smart Engines сообщила 25 апреля 2024 года.

Разработка уже используется при решении прикладных задач компьютерного зрения – для поиска объектов и распознавания текстов. Она также может стать неотъемлемой частью беспилотных автономных систем нового поколения, расширив класс задач, которые могут выполнять бортовые компьютеры.

Речь идет о прорыве отечественных ученых в области оптимизации исполнения нейронных сетей. На апрель 2024 года в основном нейросети выполняются на специализированных видеокартах, однако не каждый компьютер ими оснащен. При этом любое пользовательское устройство имеет центральный процессор, мировым стандартом для которых является использование 8-битных нейронных сетей. Однако глубокие нейронные сети усложняются, содержат сотни миллионов и более коэффициентов, что требуют большей вычислительной мощности. Это ограничивает возможность использования центральных процессоров в системах искусственного интеллекта.

Исследователи Smart Engines решили эту проблему, предложив качественное улучшение 8-битной модели – 4,6-битные сети. Она работает быстрее 8-битной модели на 40%, но практически не уступает ей по качеству за счет более эффективного использования особенностей центральных процессоров мобильных устройств.

Для этого входные данные и коэффициенты модели квантуются таким образом, чтобы их произведения помещались в 8-битные регистры. Суммирование результатов сделано с помощью двухуровневой системы 16- и 32-битных аккумуляторов для достижения максимальной эффективности. В результате в среднем на одно значение приходится 4,6 бита информации.

Такая схема квантования выгодно отличается от существующих, так как позволяет гибким образом задавать разрядность входных данных в зависимости от задачи и не привязывается к степеням двойки. Поэтому эта разработка обеспечивает заметно более высокое качество распознавание, чем, например, 4-битные модели.

Задачи компьютерного зрения должны решаться на конечных устройствах – мобильных телефонах, камерах наблюдения, бортовых компьютерах беспилотников. Все эти задачи характеризуются невысокими вычислительными возможностями устройств и существенными ограничениями по энергопотреблению. И наша разработка позволяет почти в полтора раза увеличить возможности решения этих задач. Классические сети в наших системах распознавания уже заменены на 4,6-битные аналоги, и мы продолжаем работу над более оптимальными схемами квантизации и обучения нейронных сетей — сказал генеральный директор Smart Engines, доктор технических наук Владимир Арлазаров.

Во всех программных продуктах Smart Engines «тяжелые» нейросети заменены их 4,6-битными аналогами.

Российские ученые улучшили модель диффузионной нейросети

Ученые Центра искусственного интеллекта и факультета компьютерных наук НИУ ВШЭ, а также Института искусственного интеллекта AIRI и Sber AI разработали структуру диффузионной модели, для которой возможно задать восемь видов распределения шума. Вместо классической структуры модели в виде цепи Маркова и применения нормального распределения ученые предложили звездообразную модель, где возможно выбирать тип распределения. Это поможет решать задачи в разных геометрических пространствах с помощью диффузионных моделей. Об этом 15 февраля 2024 года сообщили представители НИУ ВШЭ. Подробнее здесь.

Российские ученые нашли способ ускорить обучение нейросетей ориентироваться в пространстве

Исследователи из НИУ ВШЭ, НИТУ МИСИС и AIRI нашли способ эффективнее проводить обучение с подкреплением для нейросетей, заточенных на ориентацию в пространстве. С помощью механизма внимания эффективность работы графовой нейросети увеличилась на 15%. Результаты исследования опубликованы в журнале IEEE Access. Об этом 23 января 2024 года сообщили представители НИУ ВШЭ. Подробнее здесь.

Российские ученые научили нейросети распознавать юмор по-человечески

Группа ученых факультета компьютерных наук НИУ ВШЭ провела исследование способности нейросетей распознавать юмор. Выяснилось, что для более надежного распознавания следует изменить подход к созданию наборов данных, на которых обучаются нейросети. Такой информацией с TAdviser поделились представители НИУ ВШЭ 11 января 2024 года.

Как известно, голосовые помощники могут только рассказать готовый анекдот, придумать же свой или распознать шутливый тон они не в состоянии. При этом пользователи голосовых помощников, созданных на основе технологии искусственного интеллекта, хотят от них большей человечности — способности распознать шутку и пошутить.

С середины 2000-х годов ученые занимаются распознаванием юмора как задачей классификации «смешно — не смешно», в этой же рамке собираются и размечаются датасеты (набор данных). Группа ученых из ВШЭ предложила изменить подходы к формированию таких датасетов — сделать их более разнообразными, причем наборы данных не обязательно должны быть очень большими.

Как пояснили представители НИУ ВШЭ, задача распознавания юмора сложна еще и потому, что отсутствуют формальные критерии для определения того, что смешно, а что нет. Большинство существующих датасетов для обучения и оценки моделей распознавания юмора содержат каламбуры (puns). Сарказм и ирония еще более сложны, как и ситуативный юмор, требующий знания контекста или культурного кода.

«Мы хотели оценить переносимость и устойчивость моделей, обученных на разных датасетах. Переносимость — это то, насколько обученная на датасете с одним типом юмора модель хорошо определяет другой тип юмора. Было совсем не очевидно, как будет работать обучение, потому что юмор бывает разным», — поделился Павел Браславский, доцент факультета компьютерных наук НИУ ВШЭ.

Устойчивость же ученые проверяли «состязательными атаками» — попытками заставить нейросеть увидеть юмор там, где его нет. Нейросеть получала несмешной, но формально похожий на юмористический текст — вместо каламбура в диалоге использовалось «неправильное» созвучное слово. Чем меньше сеть попадается в такие ловушки, тем она более устойчива.

Исследователи обучали модели на стандартных датасетах для распознавания юмора и на их смесях. Кроме того, модели проходили проверку диалогами из «Алисы в Стране чудес» Льюиса Кэрролла, «Лавки древностей» Чарльза Диккенса, «Троих в лодке, не считая собаки» Джерома К. Джерома, сериалов «Ходячие мертвецы», «Друзья» и коллекцией ироничных твитов.

Оказалось, что некоторые модели переобучаются и считают все смешным.

«Мы показали разным моделям `Лавку древностей` Диккенса, а это очень грустная история, и попросили оценить происходящее. Выяснилось, что некоторые модели считают, что все диалоги из литературы XIX века смешные. И даже больше — все, что слишком непохоже на новости XXI века, принимается как юмор», — рассказал Александр Баранов, аспирант факультета компьютерных наук НИУ ВШЭ.

Модели, натренированные на каламбурах, чаще ошибаются, если в несмешном тексте одно слово заменено на созвучное. Также выяснилось, что нейросети, натренированные на небольших частях разных датасетов, распознают юмор лучше, чем обученные на большом объеме однотипных данных. Авторы делают вывод, что существующие датасеты слишком узкие, юмор в каждом из них сильно ограничен, и это снижает качество распознавания шуток.

Исследователи предложили изменить подход к обучению и оценке моделей распознавания юмора. Нужны новые датасеты, более разнообразные и близкие к обычным разговорам, естественному общению. Большие языковые модели, например ChatGPT, обученные на огромных массивах данных разных типов, в среднем хорошо справляются с распознаванием юмора, и ученые предполагают, что дело именно в разнообразии данных, на которых они учились.

«Мы сейчас говорим только о бинарном распознавании юмора: смешно или не смешно. До определения оттенков юмора, различения сарказма и иронии, распознавания ситуативного, контекстуального юмора очень далеко. У наших голосовых помощников шутки пока `гвоздями приколочены` и обложены фильтрами, определяющими, какую шутку выдать в зависимости от слов пользователя. Такая запрограммированность ответов ощущается как неестественная. Запрос на большую человечность искусственного интеллекта абсолютно понятен, но удовлетворить его будет непросто», — подчеркнул Владимир Князевский, один из авторов исследования, студент факультета компьютерных наук НИУ ВШЭ.

Исследование выполнено в рамках проекта Научно-учебной лаборатории моделей и методов вычислительной прагматики.^[3]

2022: Российские ученые представили метод классификации фотографий на базе квантовой нейросети

Российские физики лаборатории Квантовых информационных технологий Университета МИСИС, Российского квантового центра и МГУ имени М.В. Ломоносова впервые представили метод классификации фотографий с высокой точностью для 4-х классов изображений, основанный на архитектуре квантовой сверточной нейронной сети (QCNN). Об этом TAdviser сообщили представители НИТУ МИСИС 24 ноября 2022 года. Подробнее здесь.

2021

В России создали нейросеть, генерирующую картинки по описанию на русском языке

Сбер 2 ноября 2021 года сообщил TAdviser о создании нейронной сети ruDALL-E, которая способна создавать изображения на основе текстового описания на русском языке. Подробнее здесь.

26% предпринимателей доверили бы искусственному интеллекту общение с клиентами

13 октября 2021 года аналитики Platforma («Платформа больших данных») подклились результатами изучения отношения малого и среднего бизнеса к искусственному интеллекту (ИИ) и большим данным. Больше трети респондентов (36,8%) считают, что работа ИИ требует контроля и проверки результатов. Но каждый пятый (22,1%) предприниматель уже на октябрь 2021 года готов заменить личного ассистента на умную программу для выполнения персональных поручений. Подробнее здесь.

2020: Российские учёные научили искусственный интеллект «видеть» квантовые преимущества

Российские ученые из МФТИ, ФТИАН и ИТМО создали нейросеть, которая научилась предсказывать поведение квантовой системы, «взглянув» на схему этой системы. Об этом 16 января 2020 года МФТИ сообщил TAdviser.

Такая нейросеть самостоятельно находит те решения, которые хорошо подходят для демонстрации квантовых преимуществ. Это поможет исследователям разрабатывать эффективные квантовые компьютеры.

Большой круг задач современной науки решается на основе квантово-механических расчетов. Например, химические и биологические: исследования химических реакций или поиск устойчивых молекулярных структур для промышленности, медицины, фармацевтики и других областей.

Для точного решения такого рода «квантовых» задач хорошо подходят квантовые вычисления, в отличие от классических, на основе которых квантовые задачи решаются в большинстве случаев лишь громоздко и приближенно.

Процесс создания квантовых вычислительных схем — трудоемкое и дорогостоящее занятие. Не всегда получившиеся устройства показывают «квантовое превосходство» — демонстрируют скорость обработки информации быстрее обычного классического компьютера. Поэтому ученым хотелось бы иметь инструмент для прогнозирования того, будет ли какая-то схема обладать квантовым преимуществом или нет.

Одной из реализаций квантовых вычислений являются квантовые блуждания. Упрощенно можно представить этот метод как перемещение частицы по определенной сети, составленной из точек-узлов и соединений между этими узлами. Такие сети и образуют схему квантовой системы.

Если квантовое перемещение частицы — блуждание — из одного узла сети в другой оказывается быстрее классического, то можно говорить, что устройство на основе такой схемы показывает квантовое преимущество. Поиск сетей, обладающих квантовым преимуществом, является важной задачей, над которой работают эксперты в области квантовых блужданий.

Идеей Алексея Мельникова, Леонида Федичкина и Александра Алоджанца было заменить эксперта машинным интеллектом: научить компьютер различать сети и давать ответ на вопрос, в каких сетях квантовые блуждания будут давать преимущество. То есть обнаружить сети на основе которых имеет смысл строить квантовый компьютер.

Исследователи взяли нейросеть, которая «специализировалась» на распознавании изображений. На вход программе подавалась матрица смежности сети и номер входного и выходного узла. На выходе нейросеть давала ответ, будет ли квантовое блуждание между этими узлами быстрее классического.

Было неочевидно, что этот подход сработает, Но он работает, и мы очень успешно научили компьютер самостоятельно предсказывать квантовое преимущество в сетях сложной структуры,

говорит Леонид Федичкин, доцент кафедры теоретической физики МФТИ

Грань между квантовым и классическим поведением систем зачастую размыта. Изюминкой нашей работы стало создание особого компьютерного зрения, с помощью которого удалось увидеть эту грань в пространстве сетей,

поясняет Алексей Мельников, научный сотрудник ИТМО

Исследователи создали инструмент, позволяющий упростить разработку вычислительных схем на основе квантовых алгоритмов, основными приложениями которых должны стать биофотоника и материаловедение.

Например, с помощью квантовых блужданий легко описывается возбуждение фоточувствительных белков, таких как родопсин или хлорофилл. Белок — это в каком-то смысле сложная молекула, похожая на сеть. Задача понять, что произойдет с электроном, попавшим в какую-то точку в молекуле, как он будет двигаться и какое возбуждение вызывает, в переводе на формальный язык и есть поиск времени блуждания из одного узла сети в другой.

Ожидается, что расчет естественных природных процессов на квантовых блужданиях реализовать проще, чем на архитектуре из кубитов и гейтов, так как сами блуждания — это естественный физический процесс.

2019: Promt представила решения для переводов с использованием нейронных сетей

В сентябре 2019 года компания Promt представила готовые решения для переводов, использующие технологии нейронных сетей и больших данных, - Promt Neural. Их в компании называют новым этапом эволюции машинного перевода. Подробнее здесь.

2017

В Москве создадут нейросеть для распознавания показаний счетчиков воды по фото

Департамент информационных технологий (ДИТ) Москвы приступил к созданию системы на базе нейросети, предназначенной для считывания показаний счетчиков воды непосредственно с их фотографий. Научить нейронную сеть распознавать показания счетчиков на фото планируется к концу 2017 года. В целях обучения ей предстоит обработать порядка 10 тыс. таких изображений.^[4]

Создаваемая в Москве нейросеть сможет считывать показания расхода воды по фотографиям счетчиков. Фото: VistaNews.ru

Мэрия Москвы на своем сайте попросила помочь жителей города с обучением нейронной сети. Для этого им потребуется просто загрузить снимки на сайт, подтвердив затем корректность распознанных цифр. Москвичи смогут загружать неограниченное количество фото, однако должны будут следовать ряду правил при фотографировании показаний: камера должна находиться на расстоянии не более 15 см от счетчика; не менее половины снимка должно быть занято изображением счетчика; на одном фото не должно быть два счетчика и более; разрешается сделать несколько снимков одного счетчика с разных ракурсов.

Чтобы сообщить показания счетчика, жителям столицы пока приходится вводить данные вручную. Распознавание показаний по фото, как ожидается, будет занимать считанные секунды и, как результат, позволит сэкономить москвичам время.

После запуска в работу натренированной нейросети фотографии нужно будет загружать в приложения «ЖКХ Москвы», «Госуслуги Москвы» или в личный кабинет на сайте mos.ru. Предполагается, что сеть сможет распознавать цифры на фотографиях счетчиков независимо от освещения, угла съемки, возможностей камеры и качества снимков.

Создание противораковых лекарств Mail.Ru Group, Insilico Medicine и МФТИ

8 февраля 2017 года Mail.Ru Group, Insilico Medicine и МФТИ сообщили об использовании нейронной сети для создания новых лекарств. Предполагается, что эта технология поможет искать препараты в самых разных областях — от онкологии до сердечно-сосудистых заболеваний.

Российские ученые взяли за основу архитектуру состязательных автокодировщиков. Для обучения использовались молекулы с известными лечебными свойствами и эффективной концентрацией. Информацию о такой молекуле подавали на вход сети. Сеть настраивали так, чтобы на выходе получить точно такие же данные. Она была составлена из трёх структурных элементов — кодировщика, декодера и дискриминатора, — каждый из которых выполнял свою специфическую роль, «сотрудничая» с двумя другими.

Кодировщик совместно с декодером обучался сжимать и затем восстанавливать информацию об исходной молекуле, а дискриминатор помогал сделать сжатое представление более подходящим для последующего восстановления. После того как сеть обучалась на множестве известных молекул, кодировщик вместе с дискриминатором «выключались», и сеть, используя декодер, генерировала описание молекул уже сама.

Архитектура нейронной сети

По словам специалистов, эффективность обучения нейронных сетей зависит от числа входных данных и размера самой сети. В среднем хорошая нейронная сеть может обучаться за неделю. Однако поиск оптимального решения архитектуры сети может потребовать нескольких месяцев.

Мы сделали нейронную сеть генеративного типа, то есть умеющую создавать схожие вещи, на которых она обучалась. Мы обучили модель сети, которая способна создавать новые фингерпринты с заданными свойствами, — рассказал один из авторов проекта аспирант МФТИ Андрей Казеннов.

В эксперименте, проведенном Mail.Ru Group, Insilico Medicine и МФТИ, сначала сеть обучалась на множестве известных молекул, потом она генерировала описание молекул сама. Для проверки сети использовали базу патентов в области противораковых лекарств. Задачей было предсказание уже известных форм, но таких, которых не было в обучающей выборке. На большую часть предсказанных нейросетью веществ уже есть патенты.

Нейросети в мире

2024

На основе трудов советских академиков Андрея Колмогорова и Владимира Арнольда создана принципиально новая архитектура нейросетей

В конце апреля 2024 года американские исследователи из ряда научных организаций сообщили о разработке принципиально новой архитектуры нейросетей — Kolmogorov-Arnold Networks (KAN). В основу платформы положены труды советских академиков Андрея Колмогорова и Владимира Арнольда. Подробнее здесь.

Создана нейросеть, которая имитирует почерк человека

В конце декабря 2023 года специалисты из Университета искусственного интеллекта имени Мохамеда бен Заида в ОАЭ (MBZUAI) сообщили о создании нейросети, способной имитировать почерк человека. Разработчики зарегистрировали свою технологию в Управлении по патентам и товарным знакам США (USPTO). Подробнее здесь.

2023

Объем мирового рынка глубоких нейронных сетей за год вырос на треть до $24,4 млрд

По итогам 2024 года затраты на глобальном рынке глубоких нейронных сетей (DNN) достигли $24,4 млрд. Для сравнения, годом ранее объем отрасли оценивался в $18,46 млрд. Таким образом, расходы поднялись практически на треть. Об этом говорится в исследовании Market Research Future, результаты которого опубликованы 1 ноября 2024 года.

Одним из главных драйверов рынка является стремительное развитие и внедрение технологий искусственного интеллекта, в том числе генеративного. Организации все чаще используют глубокое обучение для самых разных приложений, таких как распознавание изображений и речи, обработка естественного языка и автономные системы. Этот всплеск спроса во многом обусловлен инновациями и достижениями в области вычислительных ресурсов, которые расширяют возможности и повышают эффективность DNN. Благодаря появлению мощных графических ускорителей, тензорных процессоров и других специализированных решений организации могут обрабатывать огромные массивы данных с высокой скоростью.

Передовые решения на основе ИИ внедряются во многих сферах, включая здравоохранение, финансы, автомобилестроение и розничную торговлю. Такие системы предлагают развитые аналитические возможности, что позволяет оптимизировать операции, снижать издержки и повышать выручку. Отрасль еще больше подпитывается потребностью в улучшении клиентского опыта с помощью персонализированных услуг, которые стали возможными благодаря применению ИИ-сситем. Организации, которые эффективно используют большие объемы структурированных и неструктурированных данных с помощью технологий DNN, получают конкурентное преимущество. Еще одним стимулирующим фактором названы растущие инвестиции в научно-исследовательские и опытно-конструкторские работы, связанные с технологиями глубокого обучения. Значительные средства в развитие ИИ вкладывают как частные компании, так и государственные структуры.

Авторы исследования выделяют пять основных областей применения DNN: это распознавание изображений, обработка естественного языка, распознавание речи, видеоанализ и обнаружение аномалий. В 2023 году на первый из перечисленных сегментов пришлось $6,8 млрд, на второй — $5,5 млрд. В сфере распознавания речи затраты оцениваются в $4,6 млрд, тогда как анализ видеоматериалов принес $4 млрд. Выявление аномалий обеспечило еще $3,5 млрд. Основная часть выручки приходится на программное обеспечение, включая фреймворки и платформы, необходимые для разработки и развертывания нейронных сетей. Значительный вклад вносят аппаратные решения, включая графические процессоры и специализированные ускорители. Вместе с тем все более значимыми становятся услуги, которые охватывают самые разные области — от консалтинга до развертывания и поддержки.

В географическом плане лидирует Северная Америка с оценкой в $10,5 млрд. Далее следуют Азиатско-Тихоокеанский регион с $6 млрд и Европа с $5,7 млрд. Южная Америка, Ближний Восток и Африка сообща обеспечили $2,2 млрд. В список ведущих игроков отрасли входят:

Аналитики Market Research Future полагают, что в дальнейшем среднегодовой темп роста в сложных процентах (CAGR) на рассматриваемом рынке составит 32,15%. Таким образом, к 2032 году затраты в области глубоких нейронных сетей в глобальном масштабе, согласно представленным оценкам, могут достичь $300 млрд.^[5]

Оказалось, что нейросети не способны учиться подобно человеческому мозгу из-за отсутствия сна

В конце ноября 2023 года американские специалисты из Массачусетского технологического института (MIT) обнародовали результаты исследования, в ходе которого изучались возможности глубоких нейронных сетей в плане имитации человеческого мозга. Ученые пришли к выводу, что нейросети не способны обучаться подобно людям из-за отсутствия сна.

Основная задача глубоких нейронных сетей заключается в имитации когнитивных способностей человека. Однако из-за беспрецедентной сложности человеческого мозга возникают многочисленные трудности. В частности, искусственный интеллект использует заранее определенные параметры, из-за чего наблюдаются ограничения при обработке незнакомых или неблагоприятных сценариев.

Нейросети не способны обучаться подобно людям из-за отсутствия сна

Исследования показывают, что, хотя глубокие нейронные сети достигли значительного прогресса, им не удается в полной мере имитировать человеческий мозг. Кроме того, такие системы имеют тенденцию перезаписывать существующие данные — явление, известное как катастрофическое забывание. Этот эффект оказывает негативное влияние на скорость обучения ИИ. С другой стороны, человеческий мозг, получив новую информацию, включает ее в уже существующие знания. Мозг развивает рациональную память во время отдыха: сон позволяет формировать ассоциации между объектами и информацией, которые на первый взгляд выглядят несвязанными друг с другом.

Американские исследователи предлагают включить искусственные циклы сна в глубокие нейронные сети. Предполагается, что такой подход поможет смягчить влияние катастрофического забывания и повысит эффективность обучения ИИ-моделей. Вместе с тем, признают ученые, несмотря на прогресс, для достижения паритета с человеческими когнитивными способностями нейросетям предстоит пройти долгий путь.^[6]

2017: Рекурсивной нейросети удалось взломать капчу

Ученые из американской компании Vicarious создали алгоритм, расшифровывающий капчу — самый распространенный способ отличить человека от робота. Такой алгоритм работает на основе компьютерного зрения и рекурсивной кортикальной нейросети и, по утверждению разработчиков, может расшифровать капчу на многих популярных интернет-платформах, включая PayPal и Yahoo. Работа опубликована в журнале Science.^[7]

CAPTCHA

Капча (CAPTCHA, расшифровывается как Completely Automated Public Turing test to tell Computers and Humans Apart — полностью автоматизированный публичный тест Тьюринга, позволяющий отличить человека от робота) используется для того, чтобы выяснить, кто пытается воспользоваться каким-либо сервисом: человек или какая-нибудь программа для автоматизации действий в интернете. В основе капчи обычно лежит задание, например, различить «плавающие» буквы, выделить слово на фоне или отметить фотографии, которые содержат определенный объект. Для его решения человеку достаточно имеющихся у него знаний об окружающем мире и базовых навыков (например, чтения). Компьютеру, однако, для выполнения подобного теста требуется огромное количество данных. Он может распознать любые стандартные символы, но, например, «плывущие» буквы, которые встречаются ему впервые — с трудом. С другой стороны, для человека подобная задача не представляет большой проблемы; искусственный интеллект, соответственно, должен быть максимально развит (по сравнению с настоящим, человеческим интеллектом) для ее решения.

Рекурсивная нейросеть

Ученым из Vicarious удалось разработать нейросеть для расшифровки капчи, получившую название «рекурсивная кортикальная нейросеть» (англ. recursive cortical network, сокращенно RCN). Для ее создания использовались знания об обработке визуальной информации человеком, а именно — об эффективном разделении объекта и фона, даже в том случае, когда они имеют очень похожую структуру. Созданная нейросеть способна выделять на общем фоне контур объекта (например, буквы) даже в том случае, если часть объекта скрыта за другим.

Для обучение нейросети было задействовано всего около 26 тыс. изображений. Для сравнения, алгоритму распознавания капч на основе сверточной нейросети (англ. convolutional neural network, CNN) их требуется несколько миллионов.

Для проверки работы нейросети использовались данные из открытого генератора капч Google — reCAPTCHA, особенность которых, по словам разработчиков, состоит в их сравнительной легкости распознавания для людей и сложности для компьютеров. Кроме того, для проверки были использованы капчи Yahoo, PayPal и Botdetect.

Итоги тестирования нейросети

Капча считается решенной, если компьютеру удалось распознать ее в одном проценте случаев. Нейросеть, созданная Vicarious, смогла расшифровать примеры из reCAPTCHA с точностью до 66,6%. Для сравнения, человек может распознать те же самые комбинации с точностью 87%.

George et al. / Science 2017

Примеры использованных для тренировки капч и эффективность работы нейросети на уровне слов (третий столбец) и букв (четвертый столбец)

Алгоритм также показал лучшую (по сравнению с другими алгоритмами, работа которых основана на сверточных нейросетях) эффективность в распознавании отдельных символов: до 94,3%. Для сравнения, эффективность работы сверточной нейросети существенно падает с увеличением визуальных различий между обучающей и тренировочной выборками.

George et al. / Science 2017

Эффективность распознавания отдельных символов рекурсивной нейросетью, или RCN, и сверточной нейросетью, или CNN. По оси y — доля различия данных из обучающей и тренировочной выборок

В целом эффективная работа представленного алгоритма поднимает вопрос о необходимости улучшения существующих решений по кибербезопасности и разработки средств для защиты данных пользователей от искусственного интеллекта.

Как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей

Чтобы разобраться в деталях, что такое нейронная сеть, вместе с математиком Евгением Путиным вспомним, что такое нейроны и синапсы, и как работает их система в живых организмах. Узнаем, как строение нейронных связей в мозге легло в основу алгоритмов нейронных сетей, и какие технологические задачи нейронные сети позволяют нам решать. О плюсах и минусах работы с нейронными сетями; о том, как происходит их обучение, и на что сети будут способны в недалеком будущем.

Евгений Путин — аспирант кафедры «Компьютерные Технологии» университета ИТМО, исследует проблемы интеграции концепции выбора признаков в математический аппарат искусственных нейронных сетей.

Homo ex machina: переносим сознание в компьютер

Если говорить о том, насколько реализуема идея перенесения сознания человека в машину, то можно отметить, что технологии, которые в будущем могут лечь в основу решения этой задачи, развиваются уже сегодня. Саму же задачу можно разделить на две: создание машины, которая могла бы вместить человеческое сознание, и создание технологии, которая могла бы это сознание скопировать и в эту машину перенести. Какой должна быть машина для того, чтобы она была способна эмулировать человеческое сознание? Как работает мозг, и что может быть подтверждением того, что решение задачи переноса сознания возможно в принципе? Как работают механизмы передачи информации в мозг? Чего достигли ученые в этом направлении за последние десятилетия, и что мы сможем делать в этой области в недалеком будущем?

Сергей Марков — специалист по методам машинного обучения, основатель портала «XX2 ВЕК», автор одной из сильнейших российских шахматных программ^[8].

Графовые нейросети: мимолетный тренд или за ними будущее

Основная статья: Графовые нейронные сети

Графовые нейронные сети активно применяются в машинном обучении на графах для решения локальных (классификация вершин, предсказание связей) и глобальных (схожесть графов, классификация графов) задач. Локальные методы имеют много примеров применения в обработке текстов, компьютерном зрении и рекомендательных системах. Глобальные методы, в свою очередь, применяются в аппроксимации задач, эффективно не решаемых на современных компьютерах (за исключением квантового компьютера будущего), и используются на стыке компьютерных и естественных наук для предсказания новых свойств и веществ (это актуально, например, при создании новых лекарственных препаратов).

Пика популярности графовые нейросети достигли в 2018 году, когда они стали использоваться и показали высокую эффективность в различных приложениях. Самый известный пример – модель PinSage в рекомендательной системе сервиса Pinterest. С тех пор находится все больше новых применений технологии в областях, где раньше существующие методы были не способны эффективно учитывать в моделях связи между объектами. Подробнее здесь.