Новый бесплатный ресурс для конвертации аудио в текст

Технология распознавания речи — важная часть многих устройств и сервисов. Компании часто публикуют выходные своих разработок для сторонних разработчиков. Например, в января 2018 года Facebook открыла исходный код системы wav2letter.

Китайский стартап AISense запустил бесплатный сервис Otter для конвертации голосовых сообщений в текст. Он предназначен для расшифровки интервью, лекций и личных заметок.

На основе применения лежит технология Ambient Voice Intelligence. Она распознает устная речь и в режиме реального времени преобразует ее в текстовый формат. В ходе преобразования система генерирует ключевые слова, по которым можно найти нужные фрагменты записи.

Определяющей преимуществом Otter над конкурентами является высокая точность распознавания и бесплатности сервиса. Другие программы для расшифровки аудио или допускают много ошибок, или стоят достаточно дорого. Например, представленный в декабря 2017 года сервис Amazon Transcribe расшифровывает 200-минутную запись по 4,80 $.

Приложение Otter есть в App Store и Google Play. Пока он бесплатный, но в будущем авторы хотят ввести платную подписку.

При первом запуске Otter нужно прочитать вслух показан на экране текст. Изучив запись, система создает «голосовой отпечаток» пользователя и в следующих записях отделяет его речь от реплик другого человека. Ссылка на аудиозапись из расшифрованных текстом можно отправить коллегам и работать над материалом всей командой.

Конечно, в работе программы все еще возникают ошибки. Например, искусственный интеллект плохо расставляет знаки препинания и еще хуже распознает слова в шумных местах.

Разработкой Otter занимаются выходцы из Google и компании Nuance, специализирующаяся на технологиях распознавания речи. Они представили приложение на выставке Mobile World Congress 2018, объявив, что они выбрали лучшее время для запуска. Учитывая общедоступность программы и качество конвертации они правы.

Leave a Comment

Ваш адрес email не будет опубликован.

Напишите нам

    Связаться с нами

      Call Me