Перевод с тайского по фото: распознать текст с картинки онлайн
Тайланд — одно из самых популярных туристических направлений в мире. Пхукет, Бангкок, Паттайя, Чиангмай — миллионы туристов ежегодно отдыхают в королевстве улыбок. Тайский язык использует собственное письмо (тайское — อักษรไทย), которое совершенно не похоже ни на латиницу, ни на кириллицу. Разберём, как перевести тайский текст с фото и что делает этот язык особенным для OCR.
Особенности тайского языка для OCR
Тайское письмо — одно из самых сложных для оптического распознавания. Вот основные вызовы:
- 44 согласных и 32 гласных — тайский алфавит насчитывает 76 базовых символов, не считая тоновых знаков и диакритики. Многие согласные визуально похожи: ก (k) и ถ (th), ค (kh) และ ต (t), บ (b) и ป (p). Для OCR различить их — непростая задача.
- Нет пробелов между словами — в тайском языке слова пишутся слитно, без пробелов. Пробел используется только для разделения предложений или смысловых блоков. OCR должен не только распознать символы, но и правильно сегментировать текст на слова.
- Надстрочные и подстрочные знаки — гласные и тоновые знаки располагаются сверху, снизу, слева и справа от согласной. Например, в слове เกิน (gein) гласная เ стоит слева от согласной, а ิ — сверху. OCR должен правильно скомпоновать все элементы вокруг центральной согласной.
- Тональные знаки — в тайском 5 тонов, которые обозначаются четырьмя диакритическими знаками (ไม้เอก, ไม้โท, ไม้ตรี, ไม้จัตวา). Знак над буквой меняет тон и значение слова. Например, ข่า (kha — тонизирующий) и ขา (kha — нога). Потеря тонового знака полностью меняет смысл.
- Высота символов — тайские буквы имеют разную высоту: одни занимают всю строку, другие — только верхнюю или нижнюю половину. OCR должен анализировать вертикальное расположение каждого элемента.
- Классификаторы и счётные слова — после распознавания перевод усложняется грамматикой: в тайском нет числа и рода, используются классификаторы. Например, «два человека» будет สองคน (song khon — два + человек), без изменения формы существительного.
Где пригодится перевод с тайского по фото
Путешествия по Таиланду
- Меню в уличном кафе: «ผัดไทย — 50 บาท, ต้มยำกุ้ง — 120 บาท, ส้มตำ — 40 บาท» → «Пад-тай — 50 бат, Том-ям-кунг — 120 бат, Сом-там — 40 бат».
- Вывеска: «ทางเข้า» → «Вход», «ทางออก» → «Выход», «ห้องน้ำ» → «Туалет», «ร้านขายยา» → «Аптека».
- Ценник на рынке: «มะม่วง — 80 บาท/กก.» → «Манго — 80 бат/кг», «มะพร้าว — 25 บาท» → «Кокос — 25 бат».
- Объявление в храме: «ห้ามใส่รองเท้าเข้าไปในวัด» → «Запрещено входить в храм в обуви».
Повседневная жизнь в Таиланде
Многие экспаты и цифровые кочевники живут в Таиланде месяцами. Квитанции за коммунальные услуги, договоры аренды, счета из больниц — всё это на тайском языке. ImgTranslate поможет быстро понять суть документа, не прибегая к помощи переводчика каждый раз.
Как перевести тайский текст с фото
- Откройте ImgTranslate.
- Выберите язык оригинала «Тайский», перевода — «Русский».
- Загрузите фото с тайским текстом.
- Нажмите «Перевести» — через несколько секунд получите распознанный текст и перевод.
Сервис бесплатный, не требует регистрации, не сохраняет загруженные изображения.
Заключение
Тайский — один из самых сложных языков для OCR из-за обилия визуально похожих символов, отсутствия пробелов между словами и многоуровневой структуры письма. Tesseract.js поддерживает тайский, но для наилучшего результата нужно чёткое фото с высоким разрешением. Даже частичное распознавание упрощает понимание тайского текста в путешествии или повседневной жизни.
Попробуйте перевести тайский текст с фото на ImgTranslate.