Новичок в NN's. CNN можно обучить обнаруживать один объект на изображении. Однако что делать, если любое изображение в наборе данных может содержать любое n # объектов. Не создает ли это проблемы для CNNS, поскольку выходной плотный слой должен быть фиксированного размера? Как бы вы решили эту проблему?
Например: Допустим, я произвольно выбрал 2 изображения из этого набора. Изображение 1 содержит 2 объекта, а изображение 2 содержит 5 объектов. Метка y для img1 будет содержать координаты ограничивающей рамки для 2 объектов; метка y для img2 будет содержать координаты для 5 объектов-вектор y намного больше, чем img1.
Возможное решение? :
Мне нужно было бы найти изображение с наибольшим числом объектов (обозначьте это значение как M). Предположим также, что объект имеет 4 координаты. Если M = 5, мне понадобится вектор y, равный 20. Если изображение содержит 1 объект, вектор y будет содержать 4 ненулевых значения И 16 нулевых значений. 4 ненулевых значения будут представлять координаты, а 16 нулевых значений будут представлять координаты других несуществующих объектов.