Завантажив .docx у ChatGPT, отримав переклад - і почалося: таблиця перетворилася на суцільний рядок, заголовки злилися з текстом, відступи зникли. Тепер витрачаєш годину на відновлення форматування замість того, щоб просто користуватися готовим файлом.
Ця стаття розбирає чому так відбувається (технічна причина, а не просто “ChatGPT поганий”), як правильно перекладати DOCX щоб отримати максимальний результат, і коли варто обрати інший інструмент.
Метод 1: завантажити файл напряму в ChatGPT¶
Завантаження файлів доступне безкоштовно для всіх акаунтів ChatGPT - не тільки для Plus-підписників.
Покроково:
- Відкрий ChatGPT в браузері або застосунку
- В рядку введення натисни іконку “+” зліва від поля вводу
- Вибери “Upload from computer” і обери свій .docx-файл
- Після завантаження введи промпт. Наприклад:
Переклади цей документ з англійської на українську.
Тип документа: трудовий договір.
Зберігай структуру: нумерацію розділів, абзаци, заголовки.
Юридичні терміни перекладай точно, без спрощень.
Незрозумілі або специфічні терміни залишай мовою оригіналу в дужках.
- ChatGPT прочитає файл і видасть перекладений текст у вікні чату
Що ти отримаєш: перекладений текст у чаті. Не файл - саме текст. Тобто потім тобі треба вручну скопіювати його назад у Word і відновлювати форматування.
Є ще одна опція яка може з’явитися - ChatGPT іноді пропонує “завантажити готовий .docx-файл”. Але не розраховуй на це.
All generated documents contained parts of the information. It just seems to create some random document to keep you satisfied?
Функція генерації файлів у ChatGPT нестабільна: посилання часто не працює, файл завантажується пошкодженим або містить лише частину тексту. Це відомий баг, про який повідомляють десятки користувачів уже кілька місяців поспіль. Орієнтуйся на текст у чаті - він надійніший.
Метод 2: copy-paste (надійніший для збереження змісту)¶
Якщо у тебе документ без складного форматування - листи, прості звіти, кореспонденція без таблиць - copy-paste дає більш передбачуваний результат.
Покроково:
- Відкрий документ у Word або Google Docs
- Виділи текст і скопіюй (Ctrl+C)
- Вставте в ChatGPT разом з промптом
- Отримай переклад у вигляді тексту
- Скопіюй назад у Word через Paste Special → Unformatted Text (в Word: Ctrl+Alt+V, або правою кнопкою → Paste Special)
Навіщо Paste Special? Коли ти копіюєш відповідь ChatGPT прямо з браузера, разом з текстом вставляється HTML-розмітка і приховані Unicode-символи, які Word намагається інтерпретувати і часто “ламає” форматування ще до того, як ти встиг щось зробити. Paste Special → Unformatted Text вставляє чистий текст без цього сміття.
Для великих документів: не намагайся вставити 50 сторінок за раз. ChatGPT має обмеження контекстного вікна, і на довгих текстах він починає скорочувати абзаци, пропускати речення або “забуває” контекст з початку документа. Оптимальний розмір шматка - 2-3 сторінки (800-1200 слів).
Як рекомендує один з досвідчених користувачів на Bluente Community:
Copying and pasting text bit by bit helps maintain translation consistency and tone.
Це перевірений підхід: менші шматки = кращий контроль якості кожного фрагмента.
Промпти які дають якісний результат¶
Якість перекладу залежить від промпту на 60-70%. “Переклади цей текст” - найгірший можливий варіант. Ось що реально працює:
Базовий промпт (для будь-якого документа):
Переклади текст нижче з [мова джерела] на [цільова мова].
Тип документа: [трудовий договір / технічна інструкція / медичний звіт / діловий лист].
Реєстр: [формальний / нейтральний].
Збережи структуру: нумерацію, розділи, абзаци.
Не додавай пояснень від себе - тільки переклад.
Незрозумілі терміни залишай мовою оригіналу в дужках.
З глосарієм (для технічних або юридичних документів):
Переклади текст нижче з англійської на українську.
Тип: юридичний договір.
Глосарій - ОБОВ'ЯЗКОВО перекладай тільки так:
- Counterparty = Контрагент
- Indemnification = Відшкодування збитків
- Force majeure = Обставини непереборної сили
- Whereas = Беручи до уваги
Назви компаній і власні назви не перекладай.
Чому глосарій критично важливий: без нього ChatGPT може перекласти один і той самий термін трьома різними способами в різних частинах документа. Один раз “indemnification” стає “відшкодуванням”, другий - “компенсацією”, третій - “гарантією” - і у тебе три різних юридичних смисли там де має бути один.
З роллю і контекстом (для складних документів):
Ти - досвідчений юридичний перекладач з 10-річним стажем.
Переклади документ нижче з англійської на українську.
Зберігай юридичну точність і офіційний стиль.
Правило: якщо є сумнів у правильності терміна - пиши оригінальний термін в дужках після перекладу.
Промпт з роллю дає ChatGPT більше контексту і часто покращує якість перекладу складної термінології.
Чому ламається форматування: технічна причина¶
Ось де більшість людей помиляються - вони думають що “ChatGPT не вміє форматувати”. Насправді причина в архітектурі самого .docx-файлу.
.docx - це не простий файл з текстом. Це ZIP-архів, всередині якого кілька XML-файлів:
word/document.xml- власне текст документаword/styles.xml- всі стилі (Heading 1, Normal, Bold і т.д.)word/tables.xml- визначення структури таблицьword/header1.xml,word/footer1.xml- верхні та нижні колонтитулиword/footnotes.xml- виноски[Content_Types].xml- загальна структура документа
Коли ChatGPT “читає” твій .docx - він розкриває цей архів і бере тільки document.xml, тобто голий текст. Всі інші XML-файли з форматуванням він просто ігнорує.
Як пояснює технічний аналіз від Lara Translate:
A .docx file is a ZIP archive containing XML files where text lives in word/document.xml, but formatting rules - paragraph styles, table definitions, section breaks, font embeddings - live in separate files. A translation tool that extracts only raw text and re-inserts it discards all structural context, breaking the layout.
Результат очевидний: ти отримуєш переклад тексту, але без жодної структури. Таблиця стає суцільним рядком. Heading 1 стає звичайним абзацом. Колонтитул зникає. Виноски зливаються з основним текстом.
Проблема №2 - розширення тексту. Різні мови мають різну щільність тексту для однакового змісту. Переклад з англійської на українську або польську зазвичай довший на 15-20%. З англійської на німецьку - на 20-30%.
Що це означає для таблиці: комірка яка розрахована на 20 символів англійського тексту, після перекладу на українську отримує 26-28 символів - і або таблиця “рветься”, або текст обрізається.
Проблема №3 - Unicode і прихований HTML при copy-paste. Коли копіюєш відповідь ChatGPT з браузера, разом з текстом йде HTML-розмітка і приховані Unicode-символи (непереносні пробіли, soft hyphens, zero-width characters). Word намагається їх інтерпретувати і часто “ламає” форматування ще на етапі вставки. Саме тому Paste Special → Unformatted Text - обов’язковий крок.
Коли форматування не критичне - а коли важливе¶
Не завжди втрата форматування - це катастрофа. Ось де ChatGPT підходить, а де ні:
| Тип документа | Форматування критичне? | ChatGPT підходить? |
|---|---|---|
| Простий лист або email | Ні | Так, copy-paste |
| Новини, статті, прості тексти | Ні | Так |
| Технічна інструкція (без таблиць) | Середньо | Так, з перевіркою |
| Резюме зі стилями | Так | Ні |
| Таблиця даних або прайс-лист | Так | Ні |
| Договір або контракт | Середньо | Тільки текст, без структури |
| Форма для заповнення | Так | Ні |
| Медичний або юридичний документ | Так | Ні (і якість ризикована) |
| Документ для офіційної подачі | Так | Ні (потрібен завірений переклад) |
Якщо тобі треба просто зрозуміти зміст - ChatGPT ідеально підходить і це безкоштовно. Якщо треба готовий файл який можна відправити або роздрукувати - потрібен інший підхід.
Порівняння варіантів: що обрати¶
ChatGPT (безкоштовно або $20/міс Plus)¶
Підходить для: швидкого розуміння змісту, перекладу листів і простих текстів, чернетки для подальшої редактури людиною.
Не підходить для: документів з форматуванням, великих файлів (50+ сторінок), офіційних документів.
Процес: завантаж файл або copy-paste → пиши промпт → отримуй текст у чаті → форматуй вручну у Word.
Якість: за даними Bluente Research, точність AI-перекладу коливається від 50% до 90% залежно від мовної пари і складності тексту - проти 99.8% у людини-перекладача. Для простих текстів різниця непомітна, для юридичних або медичних - суттєва.
DeepL Documents (безкоштовно до 3 файлів/міс, далі від €8.99/міс)¶
DeepL для документів працює принципово інакше: він заходить всередину XML-структури DOCX і замінює текст безпосередньо в тих самих XML-файлах, залишаючи стилі, таблиці і структуру нетронутими. Це формат-aware підхід.
Підходить для: технічних документів, посібників, корпоративної кореспонденції, де важливо зберегти форматування. Безкоштовна ліміт - 3 файли на місяць, розміром до 5 MB кожен.
Процес: заходиш на deepl.com → вкладка “Translate files” → завантажуєш .docx → отримуєш готовий .docx зі збереженим форматуванням.
Мінус: не підходить для офіційних документів (юридичної сили немає) і якість для деяких мовних пар нижча за ChatGPT.
Google Translate Documents (безкоштовно)¶
Google теж підтримує переклад .docx-файлів. Якість дещо нижча за DeepL для більшості мовних пар, але форматування зберігається значно краще ніж у ChatGPT.
Процес: відкрий translate.google.com, вкладка “Documents”, завантаж .docx, вибери мови і натисни Translate.
Лімітів немає - безкоштовно і без реєстрації.
Спеціалізований сервіс (переклад + збереження форматування)¶
Якщо документ складний - вбудовані таблиці, відступи на рівні абзаців, колонтитули з логотипами - і потрібен готовий .docx а не голий текст, є сервіси які перекладають прямо всередині XML-структури.
Один з варіантів - ChatsControl: завантажуєш .docx, AI перекладає зі збереженням форматування, є можливість перевіреного перекладу з присяжним перекладачем якщо потрібна юридична сила. Мінус - платний сервіс, і для простого листа це зайва складність. Підходить коли тобі треба і якісний переклад, і готовий форматований файл в одному місці.
Людина-перекладач¶
Єдиний варіант для офіційних документів. Якщо потрібно подати переклад в посольство, університет, суд або держустанову - потрібен завірений переклад від присяжного або нотаріально завіреного перекладача. Жоден AI тут не має юридичної сили, і такий переклад просто не приймуть.
Детальніше про ризики машинного перекладу для юридичних документів - в окремій статті з реальними прикладами помилок.
Коли ChatGPT не можна використовувати для перекладу¶
Окрім форматування, є ситуації де ChatGPT взагалі не підходить незалежно від промпту:
Рукописні документи і погані скани. ChatGPT часто неправильно “читає” рукописний текст або розмиті скани і перекладає “на здогад”, що може призвести до суттєвих помилок у фактах. Для сканів краще спеціалізований AI OCR.
Юридично значущі документи. Договір, заповіт, судовий наказ, довіреність - ціна помилки в перекладі може бути дуже висока. AI не несе відповідальності за помилку, а людина-перекладач несе.
Подача в офіційні установи. Посольства, університети, суди, нотаріуси - всі вони вимагають переклад з підписом і печаткою. ChatGPT-переклад там просто не приймуть.
Медична та фармацевтична документація. Неправильно перекладена доза або діагноз - потенційно небезпечно. Тут потрібен фаховий медичний перекладач.
Конфіденційні документи. ChatGPT за замовчуванням може використовувати дані чатів для навчання моделі. Якщо документ містить персональні дані, медичні записи або комерційну таємницю - спочатку вимкни збереження чатів в налаштуваннях або використовуй API (там дані для навчання не збираються).
Чек-лист: що перевірити після перекладу через ChatGPT¶
Навіть якщо якість тексту хороша, завжди перевіряй:
- [ ] Числа і дати. ChatGPT іноді змінює числа (“24 робочих дні” стають “20”) або плутає формати дат (день/місяць vs місяць/день)
- [ ] Власні назви. Назви компаній, прізвища, топоніми - AI їх іноді перекладає буквально або спотворює
- [ ] Одиниці виміру. “Mile” має залишатися “милею” або конвертуватися явно - не автоматично перетворюватися на “кілометр”
- [ ] Пропущені абзаци. При перекладі великих документів ChatGPT іноді “склеює” або пропускає цілі абзаци. Порівняй кількість абзаців оригіналу і перекладу
- [ ] Технічні терміни. Якщо документ технічний - перевір що термінологія відповідає галузевим стандартам, а не “творчому перекладу” AI
- [ ] Консистентність. Один і той самий термін має перекладатися однаково по всьому тексту - особливо в договорах
Порада для MTPE-підходу¶
Якщо ти перекладач або редактор і хочеш використовувати ChatGPT як перший чернетковий драфт (підхід MTPE - Machine Translation Post-Editing) - ось оптимальний workflow:
- ChatGPT або DeepL робить перший драфт
- Ти перевіряєш і виправляєш: терміни, стиль, нюанси
- Фінальна звірка з оригіналом абзац за абзацом
Реальна економія часу при MTPE - 30-50% порівняно з перекладом з нуля. Не 90%, як іноді заявляють ентузіасти, але теж суттєво. Детальніше про MTPE і AI-інструменти для перекладачів.
Джерела¶
- OpenAI Community - Broken Word Document Downloads & Formatting Errors - звіт про системні проблеми з генерацією файлів у ChatGPT
- Lara Translate - Translate Word Document Without Losing Formatting - технічне пояснення XML-структури DOCX
- Bluente Blog - How to Use ChatGPT for Translating Files - практичні методи і обмеження
- DeepL - Document Translation - як DeepL зберігає форматування при перекладі Word-файлів
- Bluente Blog - Why ChatGPT Falls Short for Document Translation - порівняння точності AI vs людина-перекладач
- doc2lang - Automating Word Document Translation with Python and ChatGPT - технічні деталі для розробників
FAQ¶
Чи може ChatGPT перекласти Word-файл зберігши форматування?¶
Ні. ChatGPT читає тільки голий текст з DOCX-файлу і ігнорує XML-структуру. Таблиці, стилі, шрифти, відступи і колонтитули зникають - отримуєш тільки переклад тексту без жодного форматування. Якщо форматування важливе, використовуй DeepL Documents або Google Translate Documents - вони працюють всередині XML-структури і зберігають форматування.
Як правильно завантажити DOCX у ChatGPT?¶
В чаті ChatGPT натисни іконку “+” або скріпку зліва від поля введення, вибери “Upload from computer” і обери .docx-файл. Після завантаження введи промпт з мовною парою, типом документа і вимогами до перекладу. Функція доступна безкоштовно, без підписки.
Чому після перекладу в ChatGPT зникають таблиці?¶
Таблиці в DOCX описані в окремих XML-файлах (table definitions), які ChatGPT не читає. Він бере тільки текст з word/document.xml - і таблиця або зникає, або перетворюється на суцільний рядок без структури і розділів.
Чи можна подати переклад від ChatGPT в посольство або університет?¶
Ні. Посольства, університети, суди і держоргани вимагають завірений переклад від сертифікованого перекладача з підписом і печаткою. ChatGPT-переклад юридичної сили не має і такі установи його просто не приймуть.
Що робити якщо ChatGPT обрізає або пропускає текст?¶
ChatGPT має обмеження контекстного вікна. Для великих документів ділиш на частини по 2-3 сторінки (800-1200 слів) і перекладаєш окремо. Зберігай однаковий промпт і глосарій для консистентності термінів по всьому документу.
Яка краща альтернатива ChatGPT для перекладу DOCX зі збереженням форматування?¶
DeepL Documents - найпопулярніший варіант: безкоштовно до 3 документів на місяць (до 5 MB кожен), далі від €8.99/міс. Google Translate Documents - безкоштовно і без ліміту. Обидва зберігають форматування значно краще за ChatGPT. Для офіційних документів з юридичною силою - тільки людина-перекладач.
Потрібен професійний переклад?
AI-переклад + перевірка перекладачем + нотаріальне завірення
Замовити переклад →