Технологии

Что такое машинное зрение и как оно устроено

14 июня 2026·7 мин чтения

Конвейер бежит со скоростью бутылка в секунду. Человек на контроле качества к концу смены устаёт, моргает, отвлекается — и бракованная крышка уезжает к покупателю. Камера не устаёт. Она смотрит на ту же крышку 30 раз в секунду и за миллисекунды решает: годная или в брак. Это и есть та задача, ради которой придумали машинное зрение.

Что такое машинное зрение простыми словами

Машинное зрение (machine vision) — это связка из камеры, света, вычислителя и алгоритма, которая позволяет технике «видеть» и принимать решения по картинке без участия человека. Ключевое слово — решение. Система не просто показывает изображение на экране, она выдаёт вердикт: брак/не брак, размер в пределах допуска или нет, есть деталь на месте или забыли поставить.

Чтобы было нагляднее: обычная камера видеонаблюдения просто пишет видео. Машинное зрение смотрит на тот же поток и говорит «вот здесь дефект, координаты такие-то». Разница — как между диктофоном и стенографисткой, которая ещё и выводы делает.

Машинное зрение и компьютерное зрение — это одно и то же?

В разговоре эти слова часто валят в кучу, но между ними есть разница — и в обиходе, и строго.

Компьютерное зрение (computer vision) — это наука и набор методов. Как вообще научить машину извлекать смысл из изображения: распознать объект, посчитать людей, найти лицо. Это «мозг» и теория.
Машинное зрение (machine vision) — это инженерная дисциплина, прикладное применение этих методов на производстве. Камера, объектив, подсветка, контроллер, реле, которое отбрасывает бракованную деталь с конвейера. Это «руки и глаза» в цеху.

Грубая аналогия: компьютерное зрение — это физика, машинное зрение — это станок, построенный по её законам. На практике в промышленности чаще говорят «машинное зрение», когда речь о готовой системе у конвейера, и «компьютерное зрение», когда о моделях и алгоритмах под капотом.

Из чего собирают систему машинного зрения

Соблазнительно думать, что вся соль в нейросети. На деле модель — лишь один из пяти кирпичей, и провал любого из остальных её топит.

Освещение. Самая недооценённая часть. Правильный свет — это половина успеха: он убирает блики, подчёркивает нужный дефект, отделяет деталь от фона. Инженеры по машинному зрению половину времени воюют именно со светом — направленным, рассеянным, контровым, ультрафиолетовым под конкретную задачу.
Оптика (объектив). Решает, что вообще попадёт на матрицу: резкость, поле зрения, отсутствие искажений по краям. Дешёвый объектив «замылит» микротрещину, которую вы как раз и ищете.
Камера (сенсор). Разрешение, скорость кадров, цветная или монохромная, обычный сенсор или специальный — рентген, тепловизор, гиперспектр. На быстром конвейере критична скорость затвора, чтобы кадр не смазался.
Вычислитель. Промышленный компьютер или встроенный модуль, который крутит модель. От него зависит, успеете ли вы обработать кадр до того, как деталь уедет.
Модель и логика. То, что превращает пиксели в вердикт, плюс «обвязка»: сигнал на реле, запись в базу, отметка оператору.

Выкини любой кирпич — и система разваливается. Идеальная модель на смазанном кадре от плохой оптики бесполезна.

Чем машинное зрение отличается от человеческого глаза

Соблазн считать камеру «искусственным глазом» обманчив. Сильные и слабые стороны у них разные — и в этом весь смысл.

Где машина выигрывает:

Не устаёт. 24/7, без обеда и без падения внимания к концу смены.
Видит то, что мы не видим. Инфракрасный и ультрафиолетовый диапазон, микронные отклонения размера, едва заметную разницу в оттенке.
Измеряет, а не прикидывает. Не «вроде ровно», а «отклонение 0,03 мм».
Повторяема. Одна и та же деталь оценивается одинаково в понедельник утром и в пятницу вечером.

Где человек пока сильнее:

Контекст и здравый смысл. Человек поймёт незнакомую ситуацию, которой не было в обучающих данных.
Гибкость. Перестроиться на новую деталь нам легко, а систему надо переучивать и перенастраивать.

Поэтому машинное зрение не «заменяет глаз», а закрывает узкую задачу там, где человек слаб: монотонность, скорость, точность измерений.

Где это работает в промышленности

Задачи приземлённые, и почти все сводятся к «посмотреть и решить»:

Контроль качества. Поиск царапин, сколов, непропаев, неправильной сборки. Самый частый сценарий — машина отлавливает брак, который человеческий глаз пропускает на скорости. Подробнее про это — в материале про обнаружение дефектов.
Измерения и контроль размеров. Бесконтактно проверить, что деталь в допуске, с точностью до микрон.
Чтение кодов и маркировки. Считать штрихкод, QR, DataMatrix, выбитый на металле номер. Соседняя задача — распознавание номеров транспорта на въезде.
Сортировка и подсчёт. Развести продукцию по сортам, пересчитать поток, проверить комплектность упаковки.
Позиционирование для роботов. Подсказать манипулятору, где именно лежит деталь и под каким углом её брать.

Эти и смежные сценарии видеоаналитики объединяет одно: камера перестаёт быть «записывающим устройством» и становится датчиком, который принимает решения.

Классические алгоритмы или нейросети?

Модный ответ «конечно, нейросети» неверен примерно в половине случаев. У двух подходов разные сильные стороны.

Классические алгоритмы (пороговая обработка, поиск контуров, шаблоны, измерение геометрии). Быстрые, предсказуемые, не требуют гор данных. Идеальны там, где задача строгая: измерить диаметр, проверить наличие отверстия, считать чёткую маркировку. Если можно описать дефект правилом — часто и не нужна нейросеть.
Нейросети берут там, где правило не сформулировать: «царапина» бывает тысячи разных форм, и описать её жёсткой логикой невозможно. Но за гибкость платят данными — модели нужны сотни и тысячи размеченных примеров брака.

На практике зрелые системы комбинируют: классика меряет геометрию и читает коды, нейросеть ловит «непонятный» дефект. Выбор инструмента — это про задачу, а не про моду.

С чего начать внедрение

Если коротко — начинать стоит не с покупки камеры, а с задачи.

Сформулируйте дефект. Что именно ловим, как выглядит «годно» и «брак», какая цена пропуска. Без этого не подобрать ни свет, ни модель.
Снимите реальные образцы. Дюжина-другая фото настоящих деталей — годных и бракованных — скажет о выполнимости больше, чем любая презентация.
Соберите пилот на одной точке. Один конвейер, одна камера, понятная метрика. Доказали на узком участке — масштабируете.
Считайте экономику. Сколько стоит один пропущенный брак или одна остановка линии — на этом и держится окупаемость.

Машинное зрение — это не «умная камера из коробки», а инженерный конвейер: свет, оптика, сенсор, вычислитель и модель, собранные под конкретную деталь. Понимаешь, из чего он состоит, — понимаешь, где система споткнётся и во что обойдётся ошибка.

// связанные услуги

Видеоаналитика для бизнеса Распознавание номеров

Хотите так же на вашем объекте?

Покажем видеоаналитику на ваших камерах и рассчитаем окупаемость. Бесплатно.

Обсудить задачу