На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Digitalocean.ru

23 подписчика

В «VK Видео» внедрили ИИ. Он распознает речь и пишет субтитры

«VK Видео» улучшает распознавание речи: точность выросла на 25%\u000D\u000A

Компания VK (ранее Mail.ru Group) анонсировала обновление платформы «VK Видео», внедрив новые алгоритмы искусственного интеллекта для автоматического распознавания речи и создания субтитров в различных видеороликах. Точность анализа и расшифровки речи увеличилась на 25%, благодаря новым технологиям нейросетей, которые теперь распознают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.

Нейросети проходят несколько этапов обработки аудиопотока: они фильтруют сторонние шумы, распознают речь и преобразуют ее в текст. Далее подключаются модели, расставляющие знаки препинания и обеспечивающие читаемость текста. Затем текст синхронизируется с аудиодорожкой, что делает субтитры более удобными для восприятия.

В ближайшем обновлении нейросети будут разделять речь разных спикеров на отдельные реплики, что упростит восприятие субтитров.

Что такое искусственный интеллект:

 

Ссылка на первоисточник

Картина дня

наверх