Перевод с корейского по фото: распознать текст с картинки онлайн
Корейская волна (Hallyu) захватила мир: K-pop, дорамы, корейская косметика, кухня, технологии. Интерес к Корее и корейскому языку растёт с каждым годом. Но корейское письмо хангыль — силабическая азбука, где буквы складываются в блоки-слоги. Разберём, как Tesseract.js справляется с корейским и как получить точный перевод с фото.
Особенности корейского языка для OCR
Корейский использует фонетическое письмо хангыль, созданное в XV веке. Это одна из самых научно спроектированных систем письма в мире, но для OCR у неё есть особенности:
- Слоговая структура — буквы (чосонгуль) группируются в квадратные блоки-слоги: 한 (h-a-n), 글 (g-eu-l). Каждый блок — отдельный иероглифоподобный символ. Tesseract.js должен разбить блок на составляющие, что сложнее, чем распознать отдельные буквы латиницы.
- Размер блока — блоки хангыля должны быть достаточного размера на фото. Если блок мелкий (например, в субтитрах или на этикетке), OCR может не разделить его на правильные буквы.
- Начальный/конечный согласные (чхосон/чонсон) — одна и та же буква может выглядеть по-разному в начале и в конце слога. Например, ᄀ в начале слога и ᆨ в конце — это одна и та же буква «киёк» (k/g), но в разных позициях. Tesseract.js корректно их обрабатывает, но на размытом фото может путать.
- Ханча (китайские иероглифы) — в корейском иногда встречаются китайские иероглифы, особенно в научных текстах, газетах и юридических документах. Хангыль и ханча могут соседствовать, и OCR должен обрабатывать их одновременно.
Где пригодится перевод с корейского по фото
K-pop и дорамы
Фанаты K-pop постоянно сталкиваются с корейским: посты любимых артистов в соцсетях, обложки альбомов, официальные объявления, субтитры к дорамам. Сфотографировали экран с субтитрами — получили перевод на русский.
Корейская косметика
Корейская косметика популярна во всём мире. Этикетки, составы, инструкции по применению — всё на корейском. ImgTranslate поможет разобрать состав крема или сыворотки:
- Этикетка: «히알루론산 세럼 — 피부 보습과 영양 공급» → «Сыворотка с гиалуроновой кислотой — увлажнение и питание кожи».
- Инструкция: «아침, 저녁 세안 후 적당량을 얼굴에 펴 바릅니다» → «Утром и вечером после умывания нанесите необходимое количество на лицо».
Путешествия в Корею
Сеул, Пусан, Чеджудо — популярные направления. Указатели в метро часто дублируются на английском, но меню в уличных кафе, объявления в магазинах и расписания автобусов — только на корейском:
- Меню: «비빔밥 — 8,000원» → «Пибимпап — 8 000 вон».
- Вывеска: «편의점 24시간» → «Круглосуточный магазин».
Корейские технологии
Samsung, LG, Hyundai — корейские бренды известны во всём мире. Инструкции к технике, гарантийные талоны, спецификации — часто на корейском. OCR поможет быстро перевести нужный раздел.
Как перевести корейский текст с фото
- Откройте ImgTranslate.
- Выберите язык оригинала «Корейский», перевода — «Русский».
- Загрузите фото с корейским текстом.
- Нажмите «Перевести» — через несколько секунд получите распознанный текст и перевод.
Сервис бесплатный, не требует регистрации, не сохраняет загруженные изображения.
Заключение
Корейский хангыль — стройная и логичная система письма. Tesseract.js поддерживает его, но для точного распознавания важно, чтобы слоговые блоки были крупными и чёткими. Мелкий текст на этикетках и упаковках может распознаваться с ошибками — в таких случаях сделайте фото с хорошим освещением и максимально приблизьте камеру.
Попробуйте перевести корейский текст с фото на ImgTranslate.