Перевод с хинди по фото: распознать текст с картинки онлайн
Хинди — один из самых распространённых языков мира, на нём говорят более 600 миллионов человек в Индии и за её пределами. Индия — популярное направление для туризма, бизнеса и IT-аутсорсинга. Хинди использует письменность деванагари, которая принципиально отличается от латиницы и кириллицы. Разберём, как перевести хинди с фото и какие сложности ждут при распознавании.
Особенности хинди и деванагари для OCR
Деванагари — слоговое письмо, где каждый символ обозначает слог, а не отдельную букву. Это создаёт уникальные вызовы для оптического распознавания:
- Основной алфавит — деванагари состоит из 47 основных символов: 14 гласных (स्वर) и 33 согласных (व्यंजन). Гласные имеют отдельную форму в начале слова и диакритическую форму (матру) при присоединении к согласным.
- Лигатуры — составные символы — в хинди согласные могут сливаться в лигатуры (संयुक्ताक्षर). Например, क + ष → क्ष (кша), त + र → त्र (тра). OCR должен правильно разложить лигатуру на составляющие, что сложно на размытых снимках.
- Верхняя линия — широреха — слова в хинди соединяются верхней горизонтальной линией (शिरोरेखा). Для OCR это плюс: символы в слове не нужно отдельно сегментировать. Но если линия прерывается из-за дефекта изображения, слово может распасться на части.
- Матра — диакритические знаки — гласные, следующие за согласным, обозначаются дополнительными значками сверху, снизу или сбоку. Например, क (ka) + ा (aa) → का (kaa). Матры могут быть маленькими и легко теряться при низком разрешении.
- Омонимы в деванагари — некоторые символы визуально похожи: द (da) и ध (dha), श (sha) и ष (sha), भ (bha) и म (ma) с матрой. OCR может путать их при плохом качестве снимка.
- Знаки препинания — в хинди используется вертикальная черта (।) для обозначения конца предложения и двойная черта (॥) для конца абзаца или стиха. Они не должны интерпретироваться как символы.
Где пригодится перевод с хинди по фото
Путешествия по Индии
- Меню в ресторане: «दाल मखनी — ₹250, बटर चिकन — ₹350, नान — ₹40» → «Дал макхани — 250 рупий, баттер чикен — 350 рупий, наан — 40 рупий».
- Вывеска: «प्रवेश द्वार» → «Вход», «बाहर निकलें» → «Выход», «चिकित्सालय» → «Больница».
- Ценник на рынке: «आम — ₹60/kg, केले — ₹30/kg» → «Манго — 60 рупий/кг, бананы — 30 рупий/кг».
- Объявление: «यहाँ धूम्रपान निषिद्ध है» → «Здесь курение запрещено».
Бизнес и IT
Индия — крупнейший центр IT-аутсорсинга. Контракты, спецификации, деловая переписка на хинди встречаются в международных компаниях. ImgTranslate поможет быстро перевести документ или скриншот рабочей переписки.
Изучение языка и культуры
Болливуд, индийская музыка, литература и йога — многие интересуются культурой Индии. OCR-перевод помогает читать индийские новости, блоги и посты в соцсетях на языке оригинала.
Как перевести текст с хинди по фото
- Откройте ImgTranslate.
- Выберите язык оригинала «Хинди», перевода — «Русский».
- Загрузите фото с текстом на хинди.
- Нажмите «Перевести» — через несколько секунд получите распознанный текст и перевод.
Сервис бесплатный, не требует регистрации, не сохраняет загруженные изображения.
Заключение
Хинди и письменность деванагари — серьёзный вызов для OCR, но Tesseract.js справляется с ним на хорошо освещённых и контрастных снимках. Лигатуры и матры требуют высокого разрешения, а широреха помогает удерживать слово целиком. Для поездки в Индию или работы с документами ImgTranslate — удобный бесплатный инструмент без регистрации.
Попробуйте перевести хинди с фото на ImgTranslate.