Як перекласти скановані документи (PDF, фото) за допомогою ШІ та OCR

Покроковий гайд з перекладу сканованих документів і фото - від вибору OCR-інструменту до фінального перекладу, з порівнянням безкоштовних і платних сервісів.

Також: RU EN UK

Фото диплому з телефону, скан паспорта в PDF, виписка з банку яку надрукували і відсканували у 150 DPI - і тепер тобі потрібно все це перекласти на німецьку. Відкриваєш файл у Google Translate - а він бачить просто картинку. Копіюєш текст з PDF - а там каша з кракозяблів. Знайомо? Тоді ця стаття для тебе: розберемо, як витягнути текст зі сканів і фото за допомогою OCR, перекласти його через ШІ, і не втратити при цьому ні форматування, ні нерви.

Що таке OCR і навіщо він потрібен для перекладу

OCR (Optical Character Recognition - оптичне розпізнавання символів) - це технологія, яка перетворює зображення тексту на реальний текст, з яким можна працювати. Простіше: ти завантажуєш фото документа, а на виході отримуєш текст, який можна копіювати, редагувати і перекладати.

Без OCR будь-який перекладач - і людина, і машина - бачить тільки картинку. Google Translate не може перекласти зображення напряму (точніше, може через камеру в додатку, але якість там сумнівна). DeepL взагалі працює тільки з текстом. І навіть ChatGPT чи Claude потребують або тексту, або зображення з достатньою якістю.

Ось типовий процес перекладу сканованого документа:

  1. Скан/фото - ти маєш файл (PDF, JPG, PNG) з текстом на зображенні
  2. OCR - технологія розпізнає текст і конвертує його в редагований формат
  3. Переклад - текст можна прогнати через перекладач (ШІ, NMT або людина)
  4. Перевірка - результат потрібно перевірити, бо і OCR, і переклад можуть додати помилок

І ось тут починається цікаве: якість кожного кроку залежить від попереднього. Поганий скан = поганий OCR = поганий переклад. Давай розберемо, як зробити кожен крок правильно.

Крок 1: підготуй скан правильно (інакше все піде не так)

Головне правило: якість OCR прямо залежить від якості вхідного зображення. Якщо ти скануєш документ - це 80% успіху.

Мінімальні вимоги до скану

  • Роздільна здатність: мінімум 300 DPI. Ідеально - 600 DPI для документів з дрібним шрифтом. Скан у 150 DPI - це привіт кракозяблам
  • Формат: PDF або PNG (без стиснення). JPG з високим стисненням “з’їдає” деталі тексту
  • Контраст: чорний текст на білому фоні - ідеально. Кольорові документи з фоновими візерунками - проблема
  • Кут: документ має бути рівно, без перекосу. Навіть 2-3 градуси нахилу можуть зіпсувати розпізнавання

Що робити, якщо скан уже поганий

Буває так, що оригінал документа далеко (наприклад, у ДРАЦС в Україні), а ти маєш тільки фото з телеграму, яке хтось зробив на бігу. Не панікуй:

  • Перед OCR пропусти зображення через фільтр: збільш контрастність, конвертуй у чорно-біле, прибери шум
  • Безкоштовні інструменти для цього: ScannerPro, Adobe Scan (мобільні), або навіть Paint.NET / GIMP на комп’ютері
  • Деякі OCR-системи (ABBYY, Google Cloud Vision) мають вбудовану передобробку зображень - використовуй їх

На одному з форумів для українців у Німеччині хтось писав: “Надіслав фото свідоцтва про народження з телефону, перекладач повернув - каже, не може прочитати половину тексту. Перефоткав з нормальним освітленням - і все ок.” Це типова ситуація.

Крок 2: обери OCR-інструмент

Інструментів для OCR більше ніж достатньо. Ось головне, що тобі потрібно знати для вибору.

Безкоштовні інструменти

Інструмент Українська Плюси Мінуси
Google Translate (камера) Так Безкоштовно, працює з телефону Низька точність, не зберігає форматування
Google Cloud Vision Так 1 000 сторінок/місяць безкоштовно, точність 98%+ Потрібен акаунт Google Cloud, не для новачків
Tesseract (open-source) Так (ukr.traineddata) Повністю безкоштовний, 100+ мов Потрібні технічні навички, залежить від якості скану
PDF24 Tools Так Онлайн, без реєстрації Обмежена точність для кирилиці

Платні інструменти

Інструмент Українська Ціна (2026) Для кого
ABBYY FineReader Так (198 мов) від $16/міс Професіонали, бюро перекладів, великі обсяги
Adobe Acrobat Pro Так від $24/міс Ті, хто вже в екосистемі Adobe
Readiris Так (138 мов) від $69 разово Фрілансери, одноразові потреби
UPDF Так від $13/міс Переклад + OCR в одному

Мультимодальні ШІ (OCR + переклад одразу)

А тепер найцікавіше. У 2026 році тобі не обов’язково робити OCR і переклад окремо. Мультимодальні моделі - GPT-4o, Claude, Gemini - можуть прочитати зображення і одразу перекласти текст в одному запиті.

Як це працює: завантажуєш фото документа прямо в чат і пишеш “переклади цей документ з української на німецьку”. Модель “бачить” текст на зображенні, розпізнає його і перекладає. Без окремого OCR-кроку.

Точність? Непогана. Claude показує CER (Character Error Rate) близько 2.1% на друкованому тексті, GPT-4o - приблизно на тому ж рівні. Для чистих документів з стандартним шрифтом це працює чудово. Для рукописного тексту або поганих сканів - все ще краще використовувати спеціалізований OCR.

Покроковий воркфлоу: від скану до готового перекладу

Ось як я рекомендую працювати зі сканованими документами, якщо тобі потрібен якісний переклад.

Варіант 1: Швидкий (для особистого використання)

  1. Завантаж фото або PDF з текстом у ChatGPT, Claude або Gemini
  2. Напиши промпт: “Розпізнай текст на зображенні і переклади його з [мова] на [мова]. Збережи структуру документа”
  3. Перевір результат - порівняй з оригіналом

Коли підходить: особисте листування, розуміння документа “для себе”, чернетка перед замовленням офіційного перекладу.

Варіант 2: Професійний (для документів, які кудись подаватимуться)

  1. Відскануй документ у 300+ DPI, формат PDF або PNG
  2. Пропусти через ABBYY FineReader або Google Cloud Vision для OCR
  3. Перевір розпізнаний текст - виправ помилки OCR вручну
  4. Переклади текст через ChatsControl або спеціалізований інструмент
  5. Вичитай переклад, порівнюючи з оригіналом речення за реченням
  6. Якщо потрібен завірений переклад - передай готовий текст заприсяжному перекладачу

Варіант 3: Пакетна обробка (для перекладачів і бюро)

  1. Налаштуй ABBYY FineReader або Tesseract для пакетного OCR
  2. Пропусти всі скани через OCR з автоматичною передобробкою
  3. Експортуй результат у DOCX або XLIFF для завантаження в CAT-інструмент
  4. Переклади з використанням Translation Memory і термінологічних баз
  5. Фінальна перевірка і QA

Типові проблеми і як їх вирішити

OCR - це не магія, і помилки будуть. Ось найчастіші проблеми і як з ними боротися.

Проблема 1: кирилиця розпізнається як латиниця (і навпаки)

Це класика. OCR плутає “В” (кирилиця) з “B” (латиниця), “С” з “C”, “Р” з “P”. Результат - текст виглядає нормально, але половина символів з неправильної кодової таблиці, і перекладач (або Translation Memory) не може з ним працювати.

Рішення: в налаштуваннях OCR вкажи мову документа явно. У Tesseract це параметр -l ukr, в ABBYY - вибір мови розпізнавання. Не залишай “автовизначення” для кириличних документів.

Проблема 2: таблиці і складне форматування

OCR непогано працює з суцільним текстом, але таблиці, колонки, зноски - це біль. Текст з різних колонок змішується, рядки таблиці зливаються.

Рішення: використовуй інструменти з підтримкою layout recognition - ABBYY FineReader і Google Document AI непогано справляються з таблицями. Для простих випадків - мультимодальний ШІ (GPT-4o, Claude) краще “розуміє” структуру документа, бо “бачить” його як картинку.

Проблема 3: рукописний текст

Рукописні примітки, підписи, дописки від руки - OCR з цим справляється погано. Навіть Google Cloud Vision дає тільки 92% точності на рукописному тексті (порівняно з 98.7% на друкованому).

Рішення: рукописні частини доведеться транскрибувати вручну. Або спробуй GPT-4o - він непогано читає розбірливий рукопис, хоча й далеко не ідеально.

Проблема 4: старі документи і нестандартні шрифти

Радянські дипломи, свідоцтва з 90-х надруковані на друкарській машинці, документи з вицвілим текстом - все це челлендж для OCR.

Рішення: збільш контраст, перевір скан на кольоровій роздільній здатності перед конвертацією в ч/б, і використовуй ABBYY FineReader - він краще за інших справляється зі складними шрифтами і нестандартними друками.

Коли OCR + ШІ достатньо, а коли потрібна людина

Давай чесно: OCR + машинний переклад - це потужний інструмент, але він не замінює професійного перекладача у всіх ситуаціях.

OCR + ШІ достатньо для:

  • Розуміння документа “для себе” (що написано в цьому листі з банку?)
  • Чернетки перекладу, яку потім вичитає людина
  • Внутрішніх документів, де не потрібна юридична точність
  • Великих обсягів тексту, де потрібен швидкий загальний переклад

Потрібна людина (перекладач) для:

Один клієнт якось розповів таку історію: “Прогнав скан свідоцтва про шлюб через OCR і ChatGPT, отримав переклад за 5 хвилин. Приніс в Standesamt - а вони кажуть, потрібен beglaubigter Übersetzung від заприсяжного перекладача. Довелося все одно замовляти нормальний переклад, але хоча б я розумів, що в документі написано, і міг перевірити переклад коли його отримав.”

Це, до речі, ідеальний підхід: зроби швидкий ШІ-переклад для розуміння, а потім замов офіційний переклад для подачі. Так ти і час не витрачаєш на очікування, і контролюєш якість фінального варіанту.

Скільки це коштує: безкоштовно vs платно

Рішення Ціна Якість OCR Якість перекладу
Google Translate (камера) Безкоштовно Середня Середня
Tesseract + DeepL Free Безкоштовно Залежить від скану Добра (до 5 000 символів)
ChatGPT / Claude (фото) $20/міс (підписка) Добра для чистих сканів Добра-відмінна
ABBYY + ChatsControl від $16/міс + ціна перекладу Відмінна Відмінна
Бюро перекладів (повний цикл) від 30-60€ за сторінку - Професійна + завірення

Для більшості людей, яким потрібно перекласти 1-3 документи, найкращий варіант - завантажити фото в ChatGPT або Claude і отримати переклад за хвилину. Якщо потрібен офіційний переклад - замовляй у заприсяжного перекладача, але хоча б ти вже розумітимеш, що в документі.

Для перекладачів і бюро - ABBYY FineReader окупається з першого тижня роботи, якщо ти регулярно працюєш зі сканами. $16 на місяць за те, щоб не набивати текст вручну - це чудова інвестиція.

FAQ

Чи можна перекласти скан документа без OCR?

Так, якщо використовуєш мультимодальні ШІ-моделі (GPT-4o, Claude, Gemini). Вони “бачать” зображення і можуть одразу розпізнати та перекласти текст без окремого OCR-кроку. Але для складних документів або великих обсягів окремий OCR все ще дає кращу якість.

Який OCR найкраще розпізнає українську?

ABBYY FineReader - безумовний лідер для кирилиці і конкретно для української. Він підтримує 198 мов і має спеціальні моделі для кириличних шрифтів. З безкоштовних варіантів - Google Cloud Vision дає точність 98%+ на чистих друкованих документах українською.

Чи збережеться форматування документа після OCR і перекладу?

Це залежить від інструменту. ABBYY FineReader і Adobe Acrobat непогано зберігають структуру (заголовки, таблиці, абзаци). Але повне збереження оригінального форматування при перекладі сканованого документа - складне завдання. Для максимальної точності краще зробити OCR, перекласти текст, і потім відтворити форматування вручну або через спеціалізовані інструменти.

Чи прийме Ausländerbehörde переклад, зроблений через OCR і ШІ?

Ні. Для офіційних інстанцій у Німеччині потрібен beglaubigte Übersetzung - завірений переклад від заприсяжного перекладача (vereidigter Übersetzer). OCR + ШІ - це інструмент для чернетки або для особистого розуміння документа, але не заміна офіційного перекладу.

Яка мінімальна якість скану для OCR?

Мінімум 300 DPI для друкованого тексту стандартним шрифтом. Для документів з дрібним текстом або складним форматуванням - 600 DPI. Фото з телефону теж працюють, але тільки якщо зроблені при хорошому освітленні, рівно, без тіней і розмитості.

Потрібен професійний переклад?

AI-переклад + перевірка перекладачем + нотаріальне завірення

Замовити переклад →