Обычно система видеоаналитики делится на два этапа:
Например: ищем лица и потом для каждого лица определяем пол и возраст. Или ищем людей на фото и определяем позу каждого человека.
Другой кейс, это когда мы сначала находим объекты на фото, а потом ищем их по базе. Для этого используются сети класса “идентификация объектов”. Такие нейросети позволяют сравнить похожесть двух картинок по различным параметрам. Например: сравнить похожесть двух лиц, или сравнить насколько два изображения человека без лица похожи (по одежде например).
Ниже представлен список все нейронных сетей, разбитых по классу решаемых задач.
Нейронные сети данного класса позволяют найти на фото все объекты определнного типа: людей, автомобили, зверей, знаки, вывески и тп. Часто нейросеть умеет определять только 2-3 типа объекта.
Существует множество нейросетей для поиска лиц и нужно подбирать конкретную сеть в зависимости от целого ряда параметров:
Чем сложнее случай, тем более "тяжелую" нейросеть нужно будет использовать.
Позволяет уточнить информацию о конкретном объекте на фотографии. Отдельные нейронные сети отвечают за свои атрибуты объекта.
Позволяет сравнивать изображения и искать по изображения по базе.
Позволяет проверять наличие выделенного лица в базе лиц (запрещающие и разрешающие списки).
Позволяет понять какие объекты находятся в кадре дальше, а какие ближе
Позволяет сохранить четкость текстов при увеличении небольших изобржений