МИСИС, МФТИ и T-Bank AI Research: Ансамблевая нейросеть (SDDE, Saliency Diversified Deep Ensembles)

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: НИТУ МИСиС (Национальный исследовательский технологический университет), Московский физико-технический институт (МФТИ), T-Bank AI Research (Центр искусственного интеллекта Т‑Банка)
Дата премьеры системы: 2024/10/31
Отрасли: Транспорт,  Фармацевтика, медицина, здравоохранение

Основная статья: Нейросети (нейронные сети)

2024: Представление нейросети SDDE

Студенты Университета МИСИС и МФТИ совместно с учеными некоммерческой лаборатории исследований искусственного интеллекта T-Bank AI Research предложили ансамблевую нейросеть SDDE (Saliency Diversified Deep Ensembles), которая с большей точностью определяет объекты на изображениях, не загруженных в базы данных. Об этом МИСИС сообщил 31 октября 2024 года. В перспективе данный алгоритм поможет развить сферу беспилотных транспортных средств и медицинской диагностики, где важно различать неопознанные элементы и графические артефакты.

С увеличением объема данных возникает потребность в более надежных нейросетях, способных не только классифицировать новые объекты, но и распознавать технические помехи, которые неизбежно возникают при получении изображения. Совокупность всей неизвестной информации называют данными вне распределения (ДВР). Человеческий фактор при обнаружении ДВР может привести к нежелательным последствиям. Создатели алгоритма решили эту задачу с помощью разнообразия ансамблевой модели, которое снизило корреляцию между вхождениями и повысило общую точность системы.

Ансамблевая нейросеть SDDE состоит из нескольких моделей, которые обучаются на подмножествах отдельно взятых баз данных, что позволяет каждой из них фокусироваться на уникальных характеристиках изображений. Это достигается с помощью диверсификации карт внимания каждой модели — концепта, позволяющего понять, куда смотрит нейросеть. В результате повышается разнообразие ансамбля и нейросеть определяет объекты на изображениях с минимальной погрешностью. Для оценки эффективности нейросети исследователи провели испытания на нескольких базах данных: CIFAR10, CIFAR100 и ImageNet-1K. Ансамблевая нейросеть SDDE продемонстрировала наилучшие результаты по сравнению со схожими алгоритмами, такими как Negative Correlation Learning и Adaptive Diversity Promoting.

«
Одной из важнейших задач при разработке моделей машинного обучения является соответствие реальной вероятности той, которую выдает нейросеть. То есть нейросеть уверена настолько, насколько ей легко предсказать таргет для данного образца. Обычно сети вообще не сомневаются в своих предсказаниях. В рамках данного исследования мы предложили метод диверсификации ансамблей, основанный на логитах — то есть, значениях, которые нейросеть выдает перед тем, как превратить их в вероятности. Это изменение позволило повысить точность "мнения" нейросети при обнаружении данных вне распределения, что критично для применения моделей в реальных условиях. Например, в режиме автономного вождения необходимо безошибочно определять объекты на дороге, чтобы предотвращать аварии. В медицинской диагностике же требуется обширная база данных для правильной постановки диагноза. Неоткалиброванные модели могут быть чрезмерно уверены в своих неверных предположениях. У нашей нейросети излишняя уверенность отсутствует, что позволяет ей более адекватно оценивать свои расчеты, — рассказал студент 3 курса Института компьютерных наук НИТУ МИСИС Максим Жданов.
»

Для лучшего обнаружения помех-артефактов исследователи использовали подход Outlier Exposure, который заключается в обучении модели на специальных наборах данных, содержащих примеры ДВР.

Ранее ученые Университета МИСИС и НИУ ВШЭ уже представили новую нейросеть LAPUSKA, которая справляется с улучшением качества изображений в 2 раза быстрее по сравнению с аналогичными продуктами.