Neurka/Инструменты/Аудио/Распознать речь

Распознать речь

Распознаёт речь из записей и видео и превращает её в готовую расшифровку

Попробовать бесплатно Все инструменты Аудио

Что делает распознать речь

Загрузите аудио или видеофайл — модель Whisper переведёт речь в текст с автоматической пунктуацией и абзацами. Точность распознавания русского на чистой записи — 95%+, на дорожке с фоновым шумом — около 85%. Поддерживается более 50 языков.

Транскрибация интервью на 30 минут занимает около минуты вместо трёх часов ручной работы. Расшифровка размечается по спикерам и времени, готовый текст копируется в буфер или скачивается в TXT — удобно для субтитров, статей и протоколов встреч.

Стоимость фиксированная — 1 токен (~4 ₽) за файл независимо от длительности, лимит — 30 минут на загрузку. Стартовых 10 бесплатных токенов хватит на десять расшифровок. Сервис работает в браузере без VPN, результат хранится в истории 7 дней.

Стоимость: 1 токен

Как это работает

Загрузите файл

Аудио или видео до 30 минут: интервью, лекция, созвон, подкаст

Дождитесь распознавания

Whisper выдаст текст с пунктуацией и разметкой по спикерам за минуту

Заберите текст

Скопируйте в буфер или скачайте TXT — для статьи, субтитров, протокола

Преимущества

1 токен (~4 ₽) за файл до 30 минут — фикс без сюрпризов

Точность 95%+ на русском, поддержка 50+ языков

Пунктуация, абзацы и разметка по спикерам из коробки

Принимает и аудио, и видео — дорожка извлекается сама

Расшифровка за минуту вместо трёх часов ручного набора

Для кого

Журналисты и редакторы

Студенты и исследователи

Менеджеры и команды на созвонах

Частые вопросы

Какая точность распознавания русской речи?▾

95%+ на чистой записи и около 85% на дорожке с фоновым шумом. Whisper корректно разбирает имена, термины и числа. Если запись шумная, прогоните её через инструмент «Очистить аудио» — точность вырастет.

Сколько стоит расшифровка?▾

1 токен (~4 ₽) за файл независимо от длительности — получасовое интервью и минутное голосовое стоят одинаково. Стартовых 10 бесплатных токенов хватает на десять расшифровок без оплаты.

Какой лимит длительности записи?▾

До 30 минут за одну загрузку. Двухчасовую лекцию разрежьте на четыре части любым редактором и распознайте по очереди — суммарно это всё равно займёт меньше 10 минут вместе с загрузкой файлов.

Поддерживаются ли видеофайлы?▾

Да, загружайте видео напрямую — звуковая дорожка извлекается автоматически. Это удобно для субтитров к YouTube-роликам, вебинарам и Reels: распознанный текст останется разбитым по таймингу речи.

Различает ли система говорящих?▾

Да, расшифровка размечается по спикерам: реплики интервьюера и гостя не смешиваются. Для записи диалога на 2-3 участников этого достаточно, чтобы сразу собрать читабельный протокол встречи.

Какие языки кроме русского распознаются?▾

Более 50: английский, испанский, немецкий, французский, китайский и другие. Язык определяется автоматически, поэтому смешанная запись с английскими терминами расшифровывается без ручных настроек.

В каком виде выдаётся результат?▾

Готовый текст с пунктуацией и абзацами: скопируйте его в буфер обмена или скачайте файлом TXT. Результат хранится в истории 7 дней — успейте сохранить расшифровку на устройство.