«VK Видео» улучшает распознавание речи: точность выросла на 25%\u000D\u000A
Компания VK (ранее Mail.ru Group) анонсировала обновление платформы «VK Видео», внедрив новые алгоритмы искусственного интеллекта для автоматического распознавания речи и создания субтитров в различных видеороликах. Точность анализа и расшифровки речи увеличилась на 25%, благодаря новым технологиям нейросетей, которые теперь распознают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.
Нейросети проходят несколько этапов обработки аудиопотока: они фильтруют сторонние шумы, распознают речь и преобразуют ее в текст. Далее подключаются модели, расставляющие знаки препинания и обеспечивающие читаемость текста. Затем текст синхронизируется с аудиодорожкой, что делает субтитры более удобными для восприятия.
В ближайшем обновлении нейросети будут разделять речь разных спикеров на отдельные реплики, что упростит восприятие субтитров.
Что такое искусственный интеллект:
Свежие комментарии