В этой статье я демонстрирую, как функция обнаружения объектов, предоставляемая службой Azure AI Vision, может эффективно идентифицировать диапазон объектов в изображении, загруженном в Optimizely CMS.
Например, в сценарии, где изображение содержит собаку, кошку и человека, процесс обнаружения объектов будет перечислять эти объекты вместе с их соответствующими координатами на изображении. Неотъемлемая полезность этой функции заключается в ее способности анализировать пространственные отношения между объектами на изображении, а также облегчать идентификацию нескольких экземпляров одного и того же объекта.
Использование функции обнаружения объектов приводит к присвоению меток на основе распознанных объектов или живых существ на изображении. С концептуальной точки зрения функция обнаружения объектов ограничивается идентификацией объектов и живых существ, тогда как функция маркировки также включает в себя контекстные термины, такие как «внутри помещения», которые невозможно локализовать с помощью ограничивающих рамок. Очень важно признать ограничения обнаружения объектов, чтобы эффективно признать или минимизировать влияние ложноотрицательных результатов (пропущенных объектов) и присущие им ограничения на детализацию.
- Объекты размером менее 5% изображения обычно не обнаруживаются.
- Объекты, расположенные близко друг к другу, например стопка тарелок, обычно не обнаруживаются.
- Названия брендов или продуктов не используются для различения объектов.
Изображение, показанное выше, будет использоваться для процесса обнаружения объектов.
Ниже приведен снимок экрана фрагмента кода, используемого для процесса обнаружения объектов.
Ответ от API
Анализ изображения — операция обнаружения объектов изображения завершена:
Высота изображения = 1000
Ширина изображения = 1600
Версия модели = 2023-02-01-предварительный просмотр
Количество обнаруженных объектов изображения = 3
«диван», Уверенность 0,6550
«кухонная техника», Доверие 0,5340
«диван», Уверенность 0,5430
Как показано в предыдущем ответе, изображение, используемое для обнаружения объектов, содержит 3 подписи. Эти подписи впоследствии сохраняются в IList.