2024/10/15 13:21:21

Компьютерное зрение
Машинное зрение


Содержание

Что такое компьютерное зрение?

Компьютерное зрение — это технология, с помощью которой машины могут находить, отслеживать, классифицировать и идентифицировать объекты, извлекая данные из изображений и анализируя полученную информацию[1].

Компьютерное зрение применяется для распознавания объектов, видеоаналитики, описания содержания изображений и видео, распознавания жестов и рукописного ввода, а также для интеллектуальной обработки изображений.

Чем машинное зрение отличается от компьютерного?

Машинное зрение использует анализ изображений для того, чтобы решать промышленные задачи. Машинное и компьютерное зрение — области связанные

Новичкам может показаться, что это разные названия одной и той же технологии, но это не так, так как компьютерное зрение — это общее название набора технологий, а машинное зрение — сфера применения.

Задачи машинного зрения

Машинное зрение позволяет отказаться от ручного труда, ведь контролировать сборку изделий, считать и измерять объекты, читать текст, цифры и идентифицировать объекты может робот.

Машинное зрение используется в различных областях. В медицине — для того, чтобы более точно ставить диагноз, в промышленности — для снижения себестоимости товаров за счёт автоматизации. В автомобильной индустрии — для навигации беспилотников, а в ритейле — для считывания штрихкодов или подсчёта посетителей.

Системы машинного зрения

Так как машинное зрение используется для решения различных промышленных задач, то в зависимости от того, какую именно задачу нужно решить, создаются специальные системы машинного зрения.

Типовые системы машинного зрения состоят из камер, ПО, процессоров, источников света, приложений программного обеспечения и различных датчиков.ИТ-директор «Роснефти» Дмитрий Ломилин выступит на TAdviser SummIT 28 ноября

Например, датчик определил, что деталь на конвейере нужно проверить, запустил камеру и сделал снимок этой детали. После этого изображение отправляется в компьютер, где программное обеспечение для машинного зрения обрабатывает полученную картинку.

После того, как изображение обработано, в зависимости от состояния детали программа пропускает или не пропускает деталь по конвейеру дальше. То есть, если деталь повреждена — программное обеспечение подаст сигнал устройству для её отклонения, остановит производство или предупредит человека о том, что есть деталь с дефектом.

2024: Как российские предприятия внедряют машинное зрение

Российские промышленные предприятия активно осваивают технологии машинного зрения, интегрируя их с искусственным интеллектом для повышения эффективности производства. О растущем интересе к этой сфере стало известно в октябре 2024 года из результатов исследования, проведенного Институтом статистических исследований и экономики знаний НИУ ВШЭ.

Согласно отчету, 78% из 2,3 тыс. опрошенных российских организаций проявляют интерес к продуктам на основе компьютерного зрения. Внедрение этих технологий происходит в несколько этапов и требует значительных инвестиций.

Как российские предприятия используют машинное зрение

Процесс интеграции машинного зрения начинается с установки специализированного оборудования. Предприятия используют IPv-камеры наружного видеонаблюдения и высокоскоростные камеры, способные снимать до 40 тыс. кадров в секунду. Современные устройства могут детектировать фракции до 1 микрометра, что позволяет контролировать состав материалов с высокой точностью.

Следующим этапом является настройка серверной инфраструктуры, которая обрабатывает большие массивы данных в виде фотографий высокого разрешения. Для снижения нагрузки на серверы применяются нейронные сети, которые анализируют только те снимки, где обнаружены отклонения от заданных параметров.

Заключительным этапом становится разработка и внедрение специального программного обеспечения, включающего модели машинного обучения и алгоритмы обработки изображений. Руководитель департамента систем машинного зрения и нейросетей Nord Clan Пётр Хвесюк отмечает, что для обучения нейросетей необходимо собрать минимум 50 тыс. фотографий, которые могут быть получены как в реальных условиях, так и синтезированы в лаборатории.

Стоимость внедрения технологий машинного зрения варьируется в зависимости от сложности проекта. По оценке эксперта ГК «Юзтех» Ильи Смирнова, базовое решение может обойтись в ₽8–15 млн, а персонализированное программное обеспечение — до ₽20 млн. Окупаемость таких проектов составляет около двух лет.[2]

2022: Искусственный интеллект распознает изображения хуже человека

Искусственный интеллект распознает изображения хуже человека.

У компьютерного зрения нет тех физиологических особенностей, которые есть у человека, поэтому оно хуже распознает изображения. К такому выводу пришли ученые из ВШЭ и Московского политехнического университета. Об этом ВШЭ сообщила 7 сентября 2022 года. Подробнее здесь. .

2021: Эксперты по компьютерному зрению закрывают проекты из-за нехватки обучающих данных

Согласно новому исследованию компании Datagen, 99% команд специалистов в области компьютерного зрения столкнулись с необходимостью закрыть проекты с использованием машинного обучения из-за недостатка данных для обучения своих моделей. Более того, по той же причине все (100%) участники исследования были вынуждены отложить проекты. Об этом стало известно 27 декабря 2021 года.

Как выяснили исследователи, проблемы с обучающими данными носят самый разный характер и затрагивают команды специалистов в равной степени. Самыми главными проблемами являются недостаточная аннотация (48%), несоответствующий охват предметной области (47%) и дефицит данных (44%).

Нехватка надежных данных для обучения в конкретной предметной области усугубляется тем фактом, что в сфере компьютерного зрения не хватает четко определенных стандартов и передовых практик.

На вопрос о том, как собираются обучающие данные в их организациях, респонденты представили целую «сборную солянку» из различных источников и методологий. Синтетические или настоящие, собранные внутри организации или полученные из публичных наборов данные – как оказалось, для обучения моделей компьютерного зрения организации используют абсолютно все данные, независимо от их происхождения.

Тем не менее, команды специалистов в области компьютерного зрения, похоже, нашли решение проблемы в виде синтетических данных. 96% опрошенных уже используют синтетические данные для обучения своих моделей искусственного интеллекта. Однако качество, источник и доля используемых синтетических данных по-прежнему сильно различаются в зависимости от области, и только 6% команд в настоящее время используют исключительно синтетические данные.

Повсеместный переход на использование синтетических данных соответствует количеству новых прогнозов о том, что 2022 год станет прорывом для синтетических данных.

В online-опросе Datagen приняли участие 300 специалистов в области компьютерного зрения, представляющих 300 отдельных предприятий[3].

2020: Компании начали заменять охранников на камеры с машинным зрением

27 апреля 2020 года стало известно, что розничные магазины, строительные и производственные компании начали оснащать свои помещения и площадки системами видеонаблюдения с искусственным интеллектом. Они следят за тем, носят ли посетители и сотрудники медицинские маски и соблюдают ли между собой дистанцию, как это требуется в связи с пандемией COVID-19. Устанавливать такие системы, стоимость которых достигает $1 тыс. в год, дешевле, чем иметь дополнительных охранников, считают участники рынка, опрошенные агентством Reuters.

Представители нескольких компаний сообщили, что видеонаблюдение с искусственным интеллектом позволит снять любые претензии, связанные с несоблюдением указаний органов здравоохранения и благополучия человека. При наличии такого решения не только посетители и сотрудники магазинов и других предприятий смогут увидеть, что правила безопасности соблюдаются в полной мере, но сделать это также смогут страховщики и регуляторы.

Розничные магазины, строительные и производственные компании начали оснащать свои помещения и площадки системами видеонаблюдения с искусственным интеллектом
«
Меньше всего мы хотим, чтобы губернатор закрыл всех нас просто потому, что никто не соблюдает предписанные рекомендации, — поделилась Джен Сьюрт (Jen Suerth), вице-президент чикагской строительной компании Pepper Construction. В апреле 2020 года она запустила «умное» видеонаблюдение на базе программного продукта SmartVid.io для отслеживания поведения рабочих.
»

Аналогичные технологии планируют внедрить производитель бриллиантов Samarth Diamond и владелец открытых торговых центров в США RPT Realty. Первая планирует использовать решение от Glimpse Analytics, вторая — RE Insight.

Заказчики уверены в возможностях технологии, потому что они уже использовали подобные инструменты для изучения покупателей, входящих в магазины, а также для обнаружения сотрудников на строительных площадках, которые пренебрегают базовыми правилами техники безопасности.[4]

Как системы компьютерного зрения помогают контролировать качество продукции

Исследования рынка компьютерного зрения

Объем мирового рынка камер с компьютерным зрением за год вырос до $7,41 млрд

В 2023 году продажи камер с компьютерным зрением в глобальном масштабе достигли $7,41 млрд. Для сравнения, годом ранее объем рынка оценивался в $6,14 млрд. Таким образом, зафиксирован рост на уровне 20%. Об этом говорится в исследовании Market Research Future, результаты которого опубликованы в начале ноября 2024 года. Подробнее здесь.

Компьютерное зрение: технологии, рынок, перспективы

Компьютерное зрение: технологии, рынок, перспективы

Глаза ИИ: что видят системы компьютерного зрения сегодня и что разглядят завтра

Глаза ИИ: что видят системы компьютерного зрения сегодня и что разглядят завтра?

Робототехника



Примечания