Whisper

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: OpenAI
Дата премьеры системы: март 2023 г.
Отрасли: Информационные технологии
Технологии: Роботы Сервисные,  Средства разработки приложений

Содержание

2024: Используемая в больницах модель OpenAI оказалась подвержена галлюцинациям

Используемая в больницах модель OpenAI оказалась подвержена галлюцинациям.

Генеративные модели искусственного интеллекта склонны к генерации некорректной информации. Удивительно, но эта проблема затронула и область автоматической транскрипции, где модель должна точно воспроизводить аудиозапись. Инженеры-программисты, разработчики и ученые серьезно обеспокоены расшифровками Whisper от OpenAI, сообщили 28 октября 2024 года в "Хайтек+" со ссылкой на Associated Press.

Исследователь из Мичиганского университета обнаружил галлюцинации в восьми из десяти аудиозаписей. Инженер по машинному обучению, изучивший более 100 часов транскрипций Whisper, нашел ошибки более чем в половине из них. А разработчик сообщил, что обнаружил вымышленные сведения почти во всех 26 000 транскрипциях, созданных им с помощью Whisper.

Ученые из Корнельского университета, Университета Вашингтона и других учреждений обнаружили, что Whisper «галлюцинирует» примерно в 1% случаев, придумывая целые предложения во время пауз в записях. Исследователи отмечают, что паузы особенно часто встречаются при речи людей с афазией. Иногда выдуманные ИИ фразы содержат агрессию и расизм, а иногда — бессмыслицу.

Галлюцинации включали вымышленные медицинские термины или фразы, которые можно было бы ожидать от видео на YouTube, например, «Спасибо за просмотр!». Сообщается, что OpenAI использовала для расшифровки более 1 млн часов видео на YouTube для обучения GPT-4.

Все это создает серьезные риски, поскольку Whisper применяется в медицинских учреждениях. Так, Whisper используется компанией Nabla в качестве инструмента медицинской транскрипции. По ее оценкам, модель расшифровала 7 млн разговоров с врачами. Более 30 000 докторов и 40 систем здравоохранения используют ИИ-инструмент. Сообщается, что Nabla знает о галлюцинациях Whisper и «решает эту проблему».«Группа Астра» в свободном доступе опубликовала курс по российской службе каталога ALD Pro для обучения администраторов 4.2 т

Представитель OpenAI заявил, что компания постоянно совершенствует свои модели, уделяя особое внимание снижению частоты появления некорректных результатов. Вместе с тем, компания подчеркивает, что использование модели Whisper в областях, где ошибки могут привести к серьезным последствиям, не рекомендуется.

«
Мы благодарим исследователей за то, что они поделились своими открытиями, — заявили в OpenAI[1].
»

2023: Анонс системы преобразования речи в текст

1 марта 2023 года компания OpenAI представила интерфейс прикладного программирования (API) для системы Whisper, которая дебютировала в сентябре 2022-го.

Whisper представляет собой интеллектуальный инструмент преобразования речи в текст, обученный на 680 000 часов многоязычных и «многозадачных» данных, собранных из интернета. Система способна корректно воспринимать произношение с акцентом, идентифицировать фоновые шумы, а также технический жаргон. Как заявляет OpenAI, решение может «надёжно» транскрибировать речь на нескольких языках, а также осуществлять перевод с этих языков на английский. Однако у Whisper есть свои ограничения, особенно в области предиктивной расшифровки. Кроме того, качество работы Whisper различается для разных языков.

OpenAI представила API открытой системы преобразования речи в текст

Благодаря появлению Whisper API сторонние разработчики смогут интегрировать эту нейросеть в свои приложения. Поддерживается работа с файлами в различных форматах, включая M4A, MP3, MP4, MPEG, MPGA, WAV и WEBM. Стоимость использования модели Whisper large-v2 составляет $0,006 в минуту. Полученный текст затем может использоваться в других приложениях на основе нейросетей.

«
Мы выпустили инструмент, но на самом деле этого было недостаточно, чтобы вся экосистема разработчиков строилась вокруг него. Whisper API — это та же большая модель, которую вы можете получить с открытым исходным кодом, но мы максимально оптимизировали её. Это намного быстрее и очень удобно, — приводит TechCrunch слова президента и председателя правления OpenAI Грега Брокмана (Greg Brockman).
»

Отмечается, что Whisper API уже используется участниками проекта Speak — приложения на основе искусственного интеллекта для изучения иностранных языков. В частности, с применением API будет создан «новый сопутствующий ИИ-продукт».[2]

Примечания



СМ. ТАКЖЕ (3)


Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (46)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (15)
  Форсайт (11)
  Axiom JDK (БеллСофт) ранее Bellsoft (10)
  Бипиум (Bpium) (10)
  Другие (389)

  Солар (ранее Ростелеком-Солар) (8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (4)
  Консом групп, Konsom Group (КонсОМ СКС) (2)
  ЛАНИТ - Би Пи Эм (Lanit BPM) (2)
  IFellow (АйФэлл) (2)
  Другие (30)

  Солар (ранее Ростелеком-Солар) (10)
  Форсайт (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Cloud.ru (Облачные технологии) ранее SberCloud (2)
  КРИТ (KRIT) (2)
  Другие (13)

  Солар (ранее Ростелеком-Солар) (6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  РЖД-Технологии (3)
  Robin (Робин) (3)
  Другие (23)

  Unlimited Production (Анлимитед Продакшен, eXpress) (3)
  Солар (ранее Ростелеком-Солар) (3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
  Axiom JDK (БеллСофт) ранее Bellsoft (1)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1)
  Другие (9)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Солар (ранее Ростелеком-Солар) (2, 48)
  Microsoft (41, 47)
  Oracle (49, 26)
  Hyperledger (Open Ledger Project) (1, 23)
  IBM (33, 18)
  Другие (595, 304)

  Солар (ранее Ростелеком-Солар) (1, 8)
  Финансовые Информационные Системы (ФИС, FIS, Финсофт) (1, 4)
  Microsoft (4, 3)
  Oracle (2, 3)
  SAP SE (2, 2)
  Другие (16, 19)

  Солар (ранее Ростелеком-Солар) (1, 11)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 3)
  Форсайт (1, 3)
  Cloud.ru (Облачные технологии) ранее SberCloud (1, 2)
  Сбербанк (1, 2)
  Другие (9, 9)

  Солар (ранее Ростелеком-Солар) (1, 6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 6)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 4)
  Мобильные ТелеСистемы (МТС) (1, 4)
  РЖД-Технологии (1, 3)
  Другие (14, 24)

  Мобильные ТелеСистемы (МТС) (2, 3)
  Солар (ранее Ростелеком-Солар) (1, 3)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 3)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 2)
  Сбербанк (1, 1)
  Другие (12, 12)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Solar appScreener (ранее Solar inCode) - 48
  Hyperledger Fabric - 23
  Windows Azure - 20
  FIS Platform - 15
  Форсайт. Мобильная платформа (ранее HyperHive) - 12
  Другие 324

  Solar appScreener (ранее Solar inCode) - 8
  FIS Platform - 4
  Турбо X - 2
  Siemens Xcelerator - 2
  Java - 2
  Другие 22

  Solar appScreener (ранее Solar inCode) - 11
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  BSS Digital2Go - 3
  Cloud ML Space - 2
  Axiom JDK (ранее Liberica JDK до 2022) - 1
  Другие 8

  EXpress Защищенный корпоративный мессенджер - 6
  Solar appScreener (ранее Solar inCode) - 6
  МТС Exolve - 4
  Форсайт. Мобильная платформа (ранее HyperHive) - 3
  РЖД и Робин: Облачная фабрика программных роботов - 3
  Другие 14

  EXpress Защищенный корпоративный мессенджер - 3
  Solar appScreener (ранее Solar inCode) - 3
  МТС Exolve - 2
  Naumen Platform - 1
  Газпром: Ивентум Конструктор приложений для организации и управления мероприятиями - 1
  Другие 9

Подрядчики-лидеры по количеству проектов

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Promobot (Промобот) (26)
  Северо-Восточный федеральный университет имени М.К. Аммосова (СВФУ) (2)
  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (2)
  Fora Robotics (Фора Роботикс) (2)
  Лаборатория робототехники Сбербанка (Sberbank Robotics Laboratory) (2)
  Другие (12)

  Promobot (Промобот) (4)
  InEnergy (ИнЭнерджи) (1)
  R2 Robotics (Р2 Робототехника) (1)
  Unitree Robotics (1)
  Сколтех (Сколковский институт науки и технологий, Skoltech) (1)
  Другие (0)

  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (1)
  Promobot (Промобот) (1)
  Smart Meal Service (Смарт Мил Сервис) (1)
  НИТУ МИСиС (Национальный исследовательский технологический университет) (1)
  РИР (Росатом Инфраструктурные решения) (1)
  Другие (0)

  Fora Robotics (Фора Роботикс) (2)
  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (1)
  Другие (0)

  Pudu Robotics (Pudu Technology) (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Promobot (Промобот) (4, 27)
  Специальные технологии контроля (СТК) (3, 2)
  НИТУ МИСиС (Национальный исследовательский технологический университет) (3, 2)
  Северо-Восточный федеральный университет имени М.К. Аммосова (СВФУ) (1, 2)
  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (1, 2)
  Другие (58, 15)

  Promobot (Промобот) (2, 4)
  Unitree Robotics (1, 1)
  InEnergy (ИнЭнерджи) (1, 1)
  R2 Robotics (Р2 Робототехника) (1, 1)
  Сколтех (Сколковский институт науки и технологий, Skoltech) (1, 1)
  Другие (0, 0)

  Smart Meal Service (Смарт Мил Сервис) (1, 1)
  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (1, 1)
  Rozum Robotics (Розум Роботикс) (1, 1)
  НИТУ МИСиС (Национальный исследовательский технологический университет) (1, 1)
  Promobot (Промобот) (1, 1)
  Другие (0, 0)

  Fora Robotics (Фора Роботикс) (1, 2)
  НИТУ МИСиС (Национальный исследовательский технологический университет) (1, 1)
  3D Bioprinting Solutions (3Д Биопринтинг Солюшенс) (1, 1)
  Rozum Robotics (Розум Роботикс) (1, 1)
  Другие (0, 0)

  Pudu Robotics (Pudu Technology) (1, 2)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2021 год
2022 год
2023 год
Текущий год

  Promobot - 26
  СВФУ Робот-дезинфектор - 2
  Pudu CC1 Робот-уборщик - 2
  МИСиС и 3D Bioprinting Solutions: 3D-биопринтер в виде роборуки для применения в операционной in situ - 2
  For-1 Антропоморфный робот - 2
  Другие 10

  Promobot - 4
  Promobot Robox - 1
  Unitree Robotics A1 Робособака - 1
  R2 Robotics Робот-мерчандайзер - 1
  Сколтех и InEnergy: UltraBot для интеллектуальной дезинфекции помещений - 1
  Другие 0

  Smart Meal Service: Lunch fastPass Робот-кассир - 1
  Робот-врач Promobot - 1
  МИСиС и 3D Bioprinting Solutions: 3D-биопринтер в виде роборуки для применения в операционной in situ - 1
  Другие 0

  For-1 Антропоморфный робот - 2
  МИСиС и 3D Bioprinting Solutions: 3D-биопринтер в виде роборуки для применения в операционной in situ - 1
  Другие 0

  Pudu CC1 Робот-уборщик - 2
  Другие 0