2020/05/07 21:55:37

Перспективы развития математического аппарата ИИ или есть ли жизнь за пределами ML/DL?

Сегодня в обыденном сознании ставится знак равенства между технологиями искусственного интеллекта (ИИ) и глубоким машинным обучением. Однако восхождение проектов ИИ по лестнице сложности и масштабности от частных узкоспециализированых решений к комплексным глубоко интегрированным системам требует модернизации применяемых математических аппаратов. Чего не хватает технологиям ML/DL с учетом бурных темпов их нынешнего развития? Эксперты поделились с TAdviser своими представлениями о будущем математики искусственного интеллекта.

Статья входит в обзор TAdviser "Технологии и решения искусственного интеллекта: точка перелома"

Содержание

Основная статья: Искусственный интеллект (ИИ, Artificial intelligence, AI)

Эволюция технологий

Наталья Лукашевич, ведущий научный сотрудник НИВЦ МГУ, профессор кафедры теоретической и прикладной лингвистики МГУ, рассказывает:

«
Мы видим, что сейчас преобладают векторные представления единиц текстов разного уровня: слов, предложений, документов. Такое подход начал распространяться с 90-х годов XX века, когда получила признание векторная модель информационного поиска. В данной модели документ представляется как точка (вектор) в пространстве координат, которые соответствуют словам, присутствующим в текстовой коллекции. В настоящее время нейронные сети обучают векторные представления слов на основе контекстов их встречаемости в текстах.
»

В сфере представления знаний, отмечает эксперт, больше всего востребованы семантические сети разного вида. Так, в автоматической обработке текстов примерами таких семантических сетей являются всемирно известный тезаурус WordNet и подобные ресурсы для других языков (для русского языка RuWordNet), а также графы знаний (knowledge graphs), которые хранят огромные объемы структурированной фактографической информации, востребованной, например, в информационном поиске, в сервисах ответов на вопросы, чат-ботах. В отличие от более сложных логических представлений, семантические сети интуитивно понятны и масштабируемы, в них можно реализовывать эффективный поиск информации и логический вывод. Кроме того, применяются подходы к представлению структур семантических сетей (графов) в виде векторов.

«
Возможно, что комбинированные подходы (нейронные сети + семантические сети) могут быть использованы для улучшения интерпретации результатов, полученных на основе нейронных сетей,
отметила Наталья Лукашевич.
»

Достижения сегодняшнего дня

В центре происходящих событий сегодня находятся алгоритмы глубокого обучения. Правда, сами по себе они вовсе не являются некоей «волшебной палочкой», способной придать развитию систем искусственного интеллекта невиданное ускорение.

«
Это просто вычислительная структура, которая впервые позволила нам осуществлять достаточно «глубокую» нелинейную переработку входной информации при решении оптимизационных задач определенного вида. Например, минимизации количества ошибок на выборке при обучении с учителем. Или минимизации суммы штрафов при обучении с подкреплением,
поясняет Юрий Визильтер, начальник подразделения интеллектуального анализа данных и технического зрения ГосНИИ Авиационных систем, профессор РАН.
»

Вполне вероятно, полагает ученый, что может появиться какая-то другая тоже удачная вычислительная структура, и она, в свою очередь, станет еще одним важным шагом вперед.

«
Но и это вряд ли обеспечит выход на качественно новый уровень. Такая новая революция пока не просматривается, хотя новые решения нужно искать всегда,
резюмирует Юрий Визильтер.
»

Пока не существует универсального подхода, который был бы сопоставим с любым частным подходом в его области компетенции, отмечает Михаил Бурцев, заведующий лабораторией нейронных систем и глубокого обучения МФТИ, руководитель проекта iPavlov НТИ. Если мы хотим иметь систему с максимальными возможностями в каждый момент времени, для этого необходимо проводить исследования по комбинации существующих подходов для объединения их сильных сторон, а также параллельно работать над оригинальными прорывными теориями ИИ, уверен он.

«
Рыночная ситуация меняется очень быстро, и соблазн обогатить классические предиктивные модели машинным обучением очень велик. Именно продвинутое прогнозирование, сценарное моделирование ситуации («а что, если я сделаю скидку на товар А в размере Х%, как изменится спрос на него, какая доля спроса будет оттянута на товары-заменители» и т.п.) будет активно развиваться и будет иметь колоссальный спрос. Сейчас о включении такого рода функционала в свой план развития не говорит только ленивый,
замечает Сергей Куликовский, генеральный директор компании «Полиматика».
»

По оценкам Сергея Свиридова, директора по исследованиям компании «Цифра», наиболее перспективной технологией, которая может найти широкое применение в задачах промышленных предприятий, является обучение с подкреплением (Reinforcement learning, RL).

«
Однако, несмотря на стремительное развитие этой области и перспективы, которые она открывает для оптимизации производственных, логистических и других процессов, ее применение в задачах реального мира несет ряд рисков и технологических сложностей, которые тормозят внедрения в реальный бизнес,
предупреждает эксперт.
»

Решения завтрашнего дня

Отрасль ИИ ищет наилучшие сочетания нейронных сетей с другими методами. Например, генетические алгоритмы различных видов сегодня используются в нейронных сетях и гибридных системах для оптимизации параметров функций принадлежности входных и выходных переменных. Появляются работы, в которых генетический алгоритм выполняет структурный синтез нейронной сети, в частности, определяет тип сети, количество скрытых слоев и нейронов, выбирает функции оптимальности. Иными словами, с помощью компьютерного моделирования становится возможным наблюдать разработку нейронной сети (или развитие когнитивной структуры) в ходе искусственно организованной эволюции.

«
Что касается сочетания DL/RL с эволюционными и генетическими алгоритмами, это, действительно, мощный инструмент, и он уже вовсю используется, например, при решении игровых задач и AutoML (автоматическое машинное обучение). Думаю, это как раз столбовая дорога развития ML в целом,
считает Юрий Визильтер.
»

Нечеткие нейронные сети

Сергей Германович, технический директор компании «Полиматика», видит перспективы в интеграции нейронных сетей и нечеткой математики. Правда, это вопрос не сегодняшнего дня. Сегодня, с точки зрения бизнеса, гораздо более стабильный результат дает сценарное моделирование, выполненное традиционными методами численной аналитики.

Что касается математического аппарата нечеткой логики, то он появился достаточно давно, в прошлом веке. Но его практическое применение до широкого распространения искусственных нейронных сетей было ограниченным, говорит эксперт, а сегодня появляются интеллектуальные системы, способные строить предположения на основе большой совокупности исходных данных. Он приводит пример утверждения, с которым может работать такая система:

«
Данное предположение, условно, можно назвать верным.
»

Гипотезы такого уровня могут генерировать нейро-нечеткие нейронные сети, и это, по мнению Сергея Германовича, открывает широкие возможности для реализации коммерчески-успешных проектов в области аналитики данных для различных секторов экономики.
«
Например, технология, которая в режиме реального времени предсказывает ваши потребности на основе анализа совокупности динамических данных из различных источников. Какой экономический результат будет получен при применении такой технологии для персонализации рекламных контактов? Это вообще невозможно сравнить с текущим «средневековым» таргетингом/ретаргетингом. Сегментация с точностью до каждого клиента уже совсем скоро станет реальностью,
предполагает Германович.
»

Правда, у нынешних нейро-нечетких нейронных сетей есть существенное ограничение - соотношение точности/интерпретируемости полученных гипотез.

Нейросети и классические логические методы

Алексей Выскребенцев, руководитель центра экспертизы решений компании «Форсайт», сравнивает достоинства и недостатки классических методов математической логики и нейросетевых алгоритмов. Что касается машинного обучения, то при отсутствии достаточного объема наблюдений, алгоритмы бессильны. Кроме того, применение нейронных сетей чувствительно к уровню шума.

«
В случае логического искусственного интеллекта машина сама выстраивает цепочку правил в зависимости от типа событий и не обязательно, чтобы под эти правила ранее были наблюдения. В этом основное отличие. Но верно и обратное: если в логическом искусственном интеллекте правило не прописано, то, к сожалению, без его добавления машина бессильна,
подчеркивает Выскребенцев.
»

По мнению эксперта, наиболее перспективны гибридные методы, объединяющие и машинное обучение, и логический искусственный интеллект:

«
Первые алгоритмы позволяют за конечное время с помощью машины создать группу правил, вторые – выстроить в цепочку принятия решений, прописать исключения и найти решения за линейное время.
»

Таким образом, в области математических методов искусственного интеллекта кипит не очень заметная внешнему глазу жизнь. Активное развитие сопровождается, во-первых, консолидацией математических методов различных типов, и, во-вторых, также стремлением к универсализации вычислительных процедур. Понадобится время для того, чтобы в этом «котле» приготовились «движки» высокоинтеллектуальных процессов нового поколения. И только после получения таких ИИ-инструментов исследователи смогут задуматься о том, как может быть реализован на практике пресловутый «сильный искусственны интеллект».

Смотрите также