Технологии
Что такое машинное зрение и как оно устроено
Конвейер бежит со скоростью бутылка в секунду. Человек на контроле качества к концу смены устаёт, моргает, отвлекается — и бракованная крышка уезжает к покупателю. Камера не устаёт. Она смотрит на ту же крышку 30 раз в секунду и за миллисекунды решает: годная или в брак. Это и есть та задача, ради которой придумали машинное зрение.
Что такое машинное зрение простыми словами
Машинное зрение (machine vision) — это связка из камеры, света, вычислителя и алгоритма, которая позволяет технике «видеть» и принимать решения по картинке без участия человека. Ключевое слово — решение. Система не просто показывает изображение на экране, она выдаёт вердикт: брак/не брак, размер в пределах допуска или нет, есть деталь на месте или забыли поставить.
Чтобы было нагляднее: обычная камера видеонаблюдения просто пишет видео. Машинное зрение смотрит на тот же поток и говорит «вот здесь дефект, координаты такие-то». Разница — как между диктофоном и стенографисткой, которая ещё и выводы делает.
Машинное зрение и компьютерное зрение — это одно и то же?
В разговоре эти слова часто валят в кучу, но между ними есть разница — и в обиходе, и строго.
- Компьютерное зрение (computer vision) — это наука и набор методов. Как вообще научить машину извлекать смысл из изображения: распознать объект, посчитать людей, найти лицо. Это «мозг» и теория.
- Машинное зрение (machine vision) — это инженерная дисциплина, прикладное применение этих методов на производстве. Камера, объектив, подсветка, контроллер, реле, которое отбрасывает бракованную деталь с конвейера. Это «руки и глаза» в цеху.
Грубая аналогия: компьютерное зрение — это физика, машинное зрение — это станок, построенный по её законам. На практике в промышленности чаще говорят «машинное зрение», когда речь о готовой системе у конвейера, и «компьютерное зрение», когда о моделях и алгоритмах под капотом.
Из чего собирают систему машинного зрения
Соблазнительно думать, что вся соль в нейросети. На деле модель — лишь один из пяти кирпичей, и провал любого из остальных её топит.
- Освещение. Самая недооценённая часть. Правильный свет — это половина успеха: он убирает блики, подчёркивает нужный дефект, отделяет деталь от фона. Инженеры по машинному зрению половину времени воюют именно со светом — направленным, рассеянным, контровым, ультрафиолетовым под конкретную задачу.
- Оптика (объектив). Решает, что вообще попадёт на матрицу: резкость, поле зрения, отсутствие искажений по краям. Дешёвый объектив «замылит» микротрещину, которую вы как раз и ищете.
- Камера (сенсор). Разрешение, скорость кадров, цветная или монохромная, обычный сенсор или специальный — рентген, тепловизор, гиперспектр. На быстром конвейере критична скорость затвора, чтобы кадр не смазался.
- Вычислитель. Промышленный компьютер или встроенный модуль, который крутит модель. От него зависит, успеете ли вы обработать кадр до того, как деталь уедет.
- Модель и логика. То, что превращает пиксели в вердикт, плюс «обвязка»: сигнал на реле, запись в базу, отметка оператору.
Выкини любой кирпич — и система разваливается. Идеальная модель на смазанном кадре от плохой оптики бесполезна.
Чем машинное зрение отличается от человеческого глаза
Соблазн считать камеру «искусственным глазом» обманчив. Сильные и слабые стороны у них разные — и в этом весь смысл.
Где машина выигрывает:
- Не устаёт. 24/7, без обеда и без падения внимания к концу смены.
- Видит то, что мы не видим. Инфракрасный и ультрафиолетовый диапазон, микронные отклонения размера, едва заметную разницу в оттенке.
- Измеряет, а не прикидывает. Не «вроде ровно», а «отклонение 0,03 мм».
- Повторяема. Одна и та же деталь оценивается одинаково в понедельник утром и в пятницу вечером.
Где человек пока сильнее:
- Контекст и здравый смысл. Человек поймёт незнакомую ситуацию, которой не было в обучающих данных.
- Гибкость. Перестроиться на новую деталь нам легко, а систему надо переучивать и перенастраивать.
Поэтому машинное зрение не «заменяет глаз», а закрывает узкую задачу там, где человек слаб: монотонность, скорость, точность измерений.
Где это работает в промышленности
Задачи приземлённые, и почти все сводятся к «посмотреть и решить»:
- Контроль качества. Поиск царапин, сколов, непропаев, неправильной сборки. Самый частый сценарий — машина отлавливает брак, который человеческий глаз пропускает на скорости. Подробнее про это — в материале про обнаружение дефектов.
- Измерения и контроль размеров. Бесконтактно проверить, что деталь в допуске, с точностью до микрон.
- Чтение кодов и маркировки. Считать штрихкод, QR, DataMatrix, выбитый на металле номер. Соседняя задача — распознавание номеров транспорта на въезде.
- Сортировка и подсчёт. Развести продукцию по сортам, пересчитать поток, проверить комплектность упаковки.
- Позиционирование для роботов. Подсказать манипулятору, где именно лежит деталь и под каким углом её брать.
Эти и смежные сценарии видеоаналитики объединяет одно: камера перестаёт быть «записывающим устройством» и становится датчиком, который принимает решения.
Классические алгоритмы или нейросети?
Модный ответ «конечно, нейросети» неверен примерно в половине случаев. У двух подходов разные сильные стороны.
- Классические алгоритмы (пороговая обработка, поиск контуров, шаблоны, измерение геометрии). Быстрые, предсказуемые, не требуют гор данных. Идеальны там, где задача строгая: измерить диаметр, проверить наличие отверстия, считать чёткую маркировку. Если можно описать дефект правилом — часто и не нужна нейросеть.
- Нейросети берут там, где правило не сформулировать: «царапина» бывает тысячи разных форм, и описать её жёсткой логикой невозможно. Но за гибкость платят данными — модели нужны сотни и тысячи размеченных примеров брака.
На практике зрелые системы комбинируют: классика меряет геометрию и читает коды, нейросеть ловит «непонятный» дефект. Выбор инструмента — это про задачу, а не про моду.
С чего начать внедрение
Если коротко — начинать стоит не с покупки камеры, а с задачи.
- Сформулируйте дефект. Что именно ловим, как выглядит «годно» и «брак», какая цена пропуска. Без этого не подобрать ни свет, ни модель.
- Снимите реальные образцы. Дюжина-другая фото настоящих деталей — годных и бракованных — скажет о выполнимости больше, чем любая презентация.
- Соберите пилот на одной точке. Один конвейер, одна камера, понятная метрика. Доказали на узком участке — масштабируете.
- Считайте экономику. Сколько стоит один пропущенный брак или одна остановка линии — на этом и держится окупаемость.
Машинное зрение — это не «умная камера из коробки», а инженерный конвейер: свет, оптика, сенсор, вычислитель и модель, собранные под конкретную деталь. Понимаешь, из чего он состоит, — понимаешь, где система споткнётся и во что обойдётся ошибка.
// связанные услуги
Хотите так же на вашем объекте?
Покажем видеоаналитику на ваших камерах и рассчитаем окупаемость. Бесплатно.