Распознавание и перевод книг и журналов с фото онлайн
Иностранная книга, научная статья или журнал — сколько полезного текста остаётся непрочитанным из-за языкового барьера. В отличие от простых вывесок или меню, книжная страница имеет свою структуру: колонки, сноски, подписи к иллюстрациям. Разберём, как перевести книгу с фото с помощью OCR.
Почему книжная страница сложнее уличной вывески
OCR (Tesseract.js) умеет распознавать печатный текст, но книжная вёрстка создаёт дополнительные сложности:
- Две и более колонок — журналы и многие научные книги верстаются в две колонки. Алгоритм может путать порядок строк, читая текст крест-накрест: сначала первую строку левой колонки, потом первую строку правой, затем вторую левой и т.д. Результат — каша из слов. Чтобы минимизировать эффект, старайтесь фотографировать каждую колонку отдельно или кадрировать изображение так, чтобы в кадр попадала только одна колонка.
- Сноски и примечания — текст внизу страницы, отделённый тонкой линией. OCR может присоединить сноску к основному тексту или, наоборот, потерять её. В книжных изданиях сноски бывают на каждом шагу — при распознавании они могут перемешаться с основным текстом или выпасть в конец.
- Подписи к иллюстрациям и таблицам — текст под рисунком или над таблицей часто имеет меньший кегль и курсивное начертание. OCR распознаёт курсив хуже прямого шрифта, особенно если разрешение снимка невысокое.
- Верхние и нижние колонтитулы — названия глав, номера страниц, авторские знаки повторяются на каждой странице. Если вы фотографируете несколько страниц подряд, колонтитулы создают лишний «шум» в распознанном тексте.
- Изгиб у корешка — текст ближе к корешку книги идёт по дуге, а не по прямой линии. Tesseract.js ожидает прямые строки — изогнутый текст распознаётся с ошибками. Прижмите книгу посильнее или сфотографируйте страницу под небольшим углом, чтобы минимизировать искривление у корешка.
Фотографируем книжную страницу правильно
- Прижмите книгу — чем плотнее раскрыта книга, тем меньше искривление у корешка. Можно прижать стеклом или прозрачной линейкой.
- Равномерное освещение — при съёмке книги часто возникает тень от страницы рядом. Используйте два источника света с обеих сторон или снимайте при дневном свете.
- Одна колонка в кадре — для журналов с двухколоночной вёрсткой кадрируйте изображение так, чтобы в кадр попадала только левая или только правая колонка.
- Не снимайте вспышкой — вспышка даёт блики на глянцевых страницах журналов. Используйте естественное освещение или лампу под углом 45 градусов.
- Высокое разрешение — для мелкого шрифта в сносках нужно минимум 300 DPI в пересчёте на исходную страницу. Современные смартфоны дают достаточное разрешение при съёмке с расстояния 15-20 см.
Как перевести книгу с фото
- Откройте ImgTranslate.
- Выберите язык книги (например, английский, немецкий, французский).
- Сфотографируйте страницу или загрузите готовый снимок.
- Нажмите «Перевести» — через несколько секунд получите распознанный текст и перевод.
Сервис бесплатный, не требует регистрации, не сохраняет загруженные изображения.
Заключение
OCR-перевод книг и журналов — отличный способ быстро понять содержание иностранной статьи или главы. Идеального распознавания сложной вёрстки ждать не стоит, но для получения общего смысла технологии вполне достаточно. Фотографируйте колонки по отдельности, прижимайте книгу у корешка и используйте хорошее освещение — и OCR покажет достойный результат. Поэкспериментируйте с переводом книг с фото на ImgTranslate.