Распознавание русского текста с фото: как перевести картинку в текст

8 июня 2026

Русский язык — один из самых сложных для оптического распознавания. Кириллица содержит буквы, похожие на латинские (например, «А», «К», «М», «О», «Т»), но с совершенно другим значением. Это создаёт дополнительные трудности для OCR-систем. В этой статье разберём, как работает распознавание русского текста с фото, какие у него особенности и как добиться максимальной точности.

Почему распознавание русского текста сложнее английского

На первый взгляд кажется, что распознать русский текст так же легко, как и английский. Но на практике возникают следующие сложности:

Омоглифы. Буквы кириллицы, которые выглядят как латинские: русская «А» и латинская «A», «С» и «C», «Р» и «P». OCR может ошибочно подставить латинский символ там, где нужен кириллический.
Сложная морфология. В русском языке много окончаний и приставок — словарь для постобработки должен быть объёмным и качественным.
Разнообразие шрифтов. Рукописные, готические, декоративные кириллические шрифты распознаются хуже стандартных.
Ё и Е. Некоторые OCR-системы путают эти буквы или игнорируют точки над Ё.

Как Tesseract.js распознаёт русский текст

ImgTranslate использует Tesseract.js версии 5 — это современный движок OCR на основе LSTM-нейросетей. Для русского языка у него есть специальная обученная языковая модель — rus. Она включает:

Словарь из десятков тысяч русских слов.
Шаблоны кириллических символов в разных шрифтах и размерах.
Поддержку знаков препинания, кавычек и тире, характерных для русского текста.

При распознавании Tesseract.js выполняет несколько этапов: предобработка изображения (превращение в оттенки серого, устранение шума), сегментация на строки и символы, классификация нейросетью и словарная проверка результата. Если выбрать язык распознавания вручную, точность повышается на 10–15% по сравнению с автоопределением.

Инструкция: как распознать русский текст с фото

Откройте сервис. Перейдите на imgtranslate.ru — никакой регистрации и установки не требуется.
Загрузите изображение. Перетащите фото в окно переводчика или выберите файл. Поддерживаются JPG, PNG, WebP.
Выберите язык. В качестве исходного укажите «Русский». Это заставит Tesseract использовать модель rus, что даст более точный результат, чем автоопределение.
Нажмите «Перевести». OCR распознает текст прямо в вашем браузере. Если перевод не нужен, просто скопируйте распознанный текст из верхнего поля.

Весь процесс занимает 5–15 секунд в зависимости от объёма текста и качества фото. Распознавание выполняется локально на вашем устройстве — изображение никуда не отправляется.

Где может пригодиться распознавание русского текста с фото

Оцифровка документов. Старые договоры, справки, накладные — отсканировали и получили редактируемый текст.
Книги и статьи. Сфотографировали страницу книги — распознали текст для цитирования или перевода.
Скриншоты с экрана. Ошибки в программах, сообщения в мессенджерах, фрагменты сайтов — всё, что нельзя скопировать стандартными средствами.
Учёба. Конспекты, лекции, задания на русском языке — распознал, сохранил, перевёл при необходимости.

Заключение

Распознавание русского текста с фото — востребованная задача, с которой современные OCR-системы справляются достаточно хорошо. ImgTranslate использует Tesseract.js с отдельной языковой моделью для русского языка, что обеспечивает точность до 98% на качественных изображениях. При этом всё распознавание выполняется локально — ваши данные остаются на вашем устройстве.

Попробуйте распознать русский текст с фото онлайн бесплатно и без ограничений.