Используя новейший метод, который имитирует мозговые функции, специалисты Microsoft заявили, что они удвоили скорость, с которой распознается и обрабатывается речь. Кроме того, эта технология позволила повысить точность распознавания на 15 процентов.

Microsoft работают над новой системой распознавания речи

Чтобы не отставать от своих главных конкурентов – Google и Apple – на рынке мобильных телефонов, программный гигант создал огромное исследовательское подразделение, чтобы завоевать признание пользователей, которые набирают текстовые сообщения или осуществляют поиск в Интернете с помощью голосовых команд.

Специалисты Microsoft заявили, что они придумали новый подход, который может повысить точность и скорость распознавания речи. Для этого они разработали вычислительную модель, имитирующую работу головного мозга. Применив так называемую глубокую нейронную сеть для распознавания голоса, программный гигант утверждает, что в ближайшее время пользователи, использующие речь для набора SMS или поиска через Bing, заметят существенный прирост скорости обработки команд, по сравнению с предыдущей технологией Microsoft.

“Точность распознавания увеличится на 15 процентов – это примерно одно слово в стандартном предложении,” сказал Майкл Тджалв, старший программный менеджер подразделения Microsoft, занимающегося голосовыми технологиями.

Внутреннее тестирование Microsoft показало, что частота ошибок в словах снизится с 16 до 13.5 процентов. Стоит отметить, что количество ошибок может варьироваться в зависимости от фонового шума и качества микрофона в мобильном телефоне.

Более того, новая технология позволяет преобразовывать речь в текс почти мгновенно. Предложение, которые обычно появляется на экране устройства через пару секунд после произношения, теперь отображается сразу, как только человек прекращает говорить.

К сожалению, Microsoft отказались сравнить скорость и точность своей системы распознавания речи с системами конкурентов, заявив, что другие компании, как правило, используют различные подходы для реализации данной технологии.

Да, прирост точности и скорости может показаться мизерным, однако для исследований в области голосовых технологий новый метод может стать настоящим прорывом. От этого выиграют клиенты Microsoft, который ежедневно пользуются данной функцией.

Для улучшения своей системы Microsoft заменили акустическую модель в прошлой технологии распознавания речи. В отчете по тестированию пять специалистов компании отметили, что использование глубоких нейронных сетей помогает минимизировать вариабельность речи, которая зачастую сбивает с толку стандартные акустические модели. Прошлая технология распознавания речи, используемая Microsoft в своих мобильных устройствах, носила название Гауссова смешанная модель.

В апреле Microsoft уже начали обновлять свои центры обработки данных, расположенные в Соединенных Штатах Америки. Процесс перехода на новую голосовую технологию в США займет еще пару недель, но компания не уточнила, когда данное обновление будет реализована на международном уровне.

Добавить комментарий

Ваш e-mail не будет опубликован.