Исследователям из компании Microsoft удалось повысить точность программы распознавания речи до человеческого уровня
Как сообщается на сайте компании,результаты последних испытаний показывают, что количество неправильно определенных слов не превышает 6% — результат сравним с уровнем профессионального наборщика, который вводит текст под диктовку.
«Это достижение является кульминацией более чем двадцати лет усилий», — рассказал руководитель исследовательской группы Microsofts Speech & Dialog Джеффри Цвейг.
Отметим, что исследователи побили собственный рекорд — месяц назад они сообщали о 6,3% неправильно определенных слов в метрике Word Error Rate. Система распознавания речи Microsoft задействует нейролингвистические модели, которые группируют слова по общности словообразовательных признаков.
Команда использовала программное обеспечение Microsoft’s Computational Network Toolkit — собственную систему для глубокого обучения. Исходный код проекта доступен на Github.
В дальнейшем Microsoft собирается использовать эту технологию в голосовом помощнике Cortana, игровой приставке Xbox One, а также в других программах с функцией распознавания речи.