Google запускает Video Intelligence API — интерфейс для распознавания образов на видео

11.12.202011.12.2020 avtor

Вчера на конференции Cloud Next в Сан-Франциско Google анонсировала запуск video intelligence — нового интерфейса, позволяющего осуществлять автоматическое распознавание и поиск объектов в пределах видеоряда.

API способен определять, когда объект, соответствующий какому-то слову (например, «тигр»), появляется на экране, а также регистрировать смену кадров. Для использования технологии нужно, чтобы видео было загружено и хранилось в облачном сервисе Google. На официальном сайте можно посмотреть демонстрацию работы с API http://anymetrica.com. Также появилась возможность оставить заявку на тестирование бета-версии в качестве разработчика.

Компания решила сделать общедоступными технологии машинного обучения, которые она разрабатывает. В качестве примера можно взять движок Cloud Machine Learning Engine, computer vision предназначенный для создания моделей машинного обучения с помощью фреймворка TensorFlow, и Vision API — интерфейс для анализа статичных изображений.