Несколько экземпляров одного и того же объекта при обнаружении изображений с помощью CNN

Question 1

Новичок в NN's. CNN можно обучить обнаруживать один объект на изображении. Однако что делать, если любое изображение в наборе данных может содержать любое n # объектов. Не создает ли это проблемы для CNNS, поскольку выходной плотный слой должен быть фиксированного размера? Как бы вы решили эту проблему?

Например: Допустим, я произвольно выбрал 2 изображения из этого набора. Изображение 1 содержит 2 объекта, а изображение 2 содержит 5 объектов. Метка y для img1 будет содержать координаты ограничивающей рамки для 2 объектов; метка y для img2 будет содержать координаты для 5 объектов-вектор y намного больше, чем img1.

Возможное решение? :

Мне нужно было бы найти изображение с наибольшим числом объектов (обозначьте это значение как M). Предположим также, что объект имеет 4 координаты. Если M = 5, мне понадобится вектор y, равный 20. Если изображение содержит 1 объект, вектор y будет содержать 4 ненулевых значения И 16 нулевых значений. 4 ненулевых значения будут представлять координаты, а 16 нулевых значений будут представлять координаты других несуществующих объектов.

Question 2

Основным способом классификации нескольких объектов является использование сегментации. Это делается путем сегментации входного изображения на несколько подобластей и передачи каждой области в нейронную сеть.

Однако это очень простой метод, и в настоящее время существует множество продвинутых алгоритмов, которые выполняют сегментацию автоматически.

Как правило, классификация нескольких объектов решается в два этапа: сначала алгоритм предложения области, чтобы угадать, какие части изображения содержат объект.

Второй - это алгоритм классификации предлагаемых регионов.

источник img

Reda El Hail · Answer 1 · 2021-11-21T05:58:06

Основным способом классификации нескольких объектов является использование сегментации. Это делается путем сегментации входного изображения на несколько подобластей и передачи каждой области в нейронную сеть.

Однако это очень простой метод, и в настоящее время существует множество продвинутых алгоритмов, которые выполняют сегментацию автоматически.

Как правило, классификация нескольких объектов решается в два этапа: сначала алгоритм предложения области, чтобы угадать, какие части изображения содержат объект.

Второй - это алгоритм классификации предлагаемых регионов.

источник img

Что-то вроде того, как быстрее R-CNN выполняет сегментацию с помощью RPN для извлечения функций, которые он считает релевантными? Правильно ли я это понимаю? Кроме того, как будет выглядеть вектор y, учитывая, что для изображений существуют переменные метки прогнозирования.

Несколько экземпляров одного и того же объекта при обнаружении изображений с помощью CNN

Вопрос

Лучший ответ

На других языках

Эта страница на других языках

Популярное в этой категории

Популярные вопросы в этой категории