Перевод с иврита по фото: распознать текст с картинки онлайн
Израиль — центр технологий, туризма и религиозного паломничества. Иврит — государственный язык Израиля, на нём говорят более 9 миллионов человек. Письменность иврита использует квадратное письмо (כתב מרובע) и имеет ряд уникальных особенностей: направление письма справа налево, конечные формы букв и огласовки (никуд). Разберём, как перевести иврит с фото и какие сложности ждут при распознавании.
Особенности иврита для OCR
Иврит представляет несколько уникальных вызовов для систем оптического распознавания:
- Направление письма: справа налево (RTL) — OCR должен правильно определить направление текста. Большинство движков, включая Tesseract.js, поддерживают RTL, но на смешанных текстах (иврит + латиница/цифры) возможны ошибки в порядке слов.
- Конечные буквы — софит — пять букв ивритского алфавита меняют форму в конце слова: כ (kaf) → ך (kaf sofit), מ (mem) → ם, נ (nun) → ן, פ (pe) → ף, צ (tsadi) → ץ. OCR должен различать формы и правильно определять позицию буквы в слове.
- Огласовки — никуд — система точек и чёрточек вокруг букв, обозначающих гласные звуки. В повседневном письме никуд чаще всего опускается, но встречается в детских книгах, поэзии и религиозных текстах. Если никуд есть, OCR может путать точки огласовок с диакритическими знаками других языков.
- Визуально похожие буквы — несколько букв иврита могут быть похожи друг на друга: ב (vet) и כ (kaf), ח (khet) и ת (tav), ו (vav) и ז (zayin), ר (resh) и ד (dalet). Разница часто в одном небольшом элементе, который может быть не виден на размытом фото.
- Буквы с точками — дагеш — точка внутри буквы (дагеш) меняет произношение: ב без точки — «в», с точкой — «б»; פ без точки — «ф», с точкой — «п». Для перевода это не критично, но для точного распознавания важно.
- Цифры и латиница — в израильских текстах часто встречаются вкрапления английских слов и цифр (цены, номера телефонов, адреса). OCR должен корректно переключаться между RTL и LTR.
Где пригодится перевод с иврита по фото
Путешествия по Израилю
- Меню в тель-авивском кафе: «חומוס — 38₪, פלאפל — 25₪, שווארמה — 55₪» → «Хумус — 38 шекелей, фалафель — 25 шекелей, шаурма — 55 шекелей».
- Вывеска: «יציאה» → «Выход», «כניסה» → «Вход», «בית חולים» → «Больница», «בית מרקחת» → «Аптека».
- Расписание на вокзале: «תל אביב — ירושלים, 09:30, רציף 2» → «Тель-Авив — Иерусалим, 09:30, платформа 2».
- Объявление: «שמירת שבת — המעלית תפעל אוטומטית» → «Соблюдение субботы — лифт будет работать автоматически».
Бизнес и стартапы
Израиль — «стартап-нация». Многие hi-tech компании работают на английском, но внутренняя документация, контракты и отчёты часто ведутся на иврите. Перевод документов с фото помогает быстро ознакомиться с содержанием, не отвлекая коллегу-переводчика.
Изучение языка и религия
Иврит — язык Танаха. Студенты-теологи, исследователи и просто интересующиеся часто работают с текстами на иврите. ImgTranslate поможет перевести фрагмент священного текста или современной статьи.
Как перевести текст с иврита по фото
- Откройте ImgTranslate.
- Выберите язык оригинала «Иврит», перевода — «Русский».
- Загрузите фото с текстом на иврите.
- Нажмите «Перевести» — через несколько секунд получите распознанный текст и перевод.
Сервис бесплатный, не требует регистрации, не сохраняет загруженные изображения.
Заключение
Иврит с его RTL-направлением и конечными буквами — интересный вызов для OCR. Tesseract.js поддерживает иврит и в целом справляется хорошо, особенно на контрастных снимках. Конечные буквы и дагеш обычно не создают проблем, а никуд встречается редко. Путешествие в Израиль или работа с ивритскими документами перестают быть языковым барьером с ImgTranslate.
Попробуйте перевести иврит с фото на ImgTranslate.