Редагування сканованого тексту в Word

У процесі роботи з текстовим процесором Ворд, у користувачів іноді виникає необхідність обробити не тільки набраний ними (або іншими людьми) текст, а й здійснювати редагування фрагменти. Наприклад, щоб не передруковувати вручну будь-якої текст, лист або що-небудь інше, відскановане і отримане в такому вигляді. Раніше, поки не були в ходу системи розпізнавання, так звані OCR, як раз і доводилося займатися такою нудною роботою. Сьогодні ж можна просто використовувати не тільки численні сторонні програми, але і вбудовані засоби Windows і, зокрема, Microsoft Office. Це навіть зручніше, адже не потрібно тримати під рукою встановлений софт, бути прив'язаним до одного комп'ютера і т. П. А в сучасному світі це досить багато значить.

Отже, є відсканований текст і завдання вставити його в власний документ так, щоб після цього фрагмента можна було правити. Є два шляхи; розглянемо обидва.

перший шлях

Він полягає в тому, щоб використовувати вбудовані засоби Microsoft Word. Справа в тому, що якщо вставити сканований фрагмент без додаткових дій, то він буде просто картинкою.Основний текст його буде обтікати, і редагувати ви зможете хіба що розмір і прозорість. Це особливо прикро, коли потрібно переробити всього лише пару рядків. Але якщо вставити цей відсканований фрагмент як об'єкт Microsoft Image Viewer в Ворд, то, власне, він вставиться як звичайний, доступний для редагування текст. Для цього потрібно простежити, щоб файл був з розширенням .tiff, а якщо немає, то скористатися Paint, відкривши його і перезаписавши в потрібному форматі. Після цього в справу вступає спеціальний компонент платформи Microsoft Office, про який ми згадували трохи вище. Саме його вам слід відкрити в головному меню. Якщо його немає, то доведеться покопатися в панелі управління.

Знайдіть в ній пункт "Установка і видалення програм", знайдіть в списку Офіс і перейдіть до вибору компонентів. Серед них ви як раз і знайдете Image Viewer, необхідний нам для виконання завдання. Після установки він з'явиться в головному меню.

Так ось, після його відкриття, drag'n'drop'ом або через меню вікна, відкрийте в цій програмі сканований файл. Потрібно буде почекати пару хвилин, так як на екрані з'явиться прогрес-бар, що відображає хід розпізнавання. По завершенні процесу, власне, відкриється вікно з розпізнаним текстом. Його ви можете скопіювати в Ворд для подальшого редагування.Звичайно, ви повинні враховувати, що розпізнавання тексту, спотвореного скануванням, може пройти не ідеально, так що варто провести так звану "вичитку", тобто відредагувати його, виправляючи неправильно розпізнані символи. Набагато гірша справа з рукописним текстом, вірогідність, що його вдасться відредагувати, сильно корелює з кольором паперу і чорнила, якістю сканування і, звичайно, розбірливість почерку. Але така робота досить рідко проводиться з рукописним текстом, зазвичай все ж мова йде про надрукованому.

другий шлях

Взагалі кажучи, другий спосіб полягає в тому ж самому, що і перший, з тією лише різницею, що для включення режиму розпізнавання тексту і його редагування використовується спочатку сторонній софт, а потім вже Word. Буде потрібно встановлена ​​програма. Можливо, вона навіть буде працювати краще, ніж рішення від Microsoft, так як подібні програми розробляються і проектуються спеціально для цього завдання. Автори обіцяють практично 100% точність в роботі з друкованим текстом і трохи скромніші цифри, коли мова заходить про рукописному. Але щоб відокремити маркетингові виверти від справжнього стану речей, доведеться ступити на стежку емпіричної перевірки.

На практиці виявляється, що розрив не такий великий.Так, комусь може здатися зручним, що не потрібно включати режим редагування тексту через зв'язку Microsoft Image Viewer - Microsoft Word, але ж для цього доведеться використовувати іншу зв'язку програм, а точність розпізнавання символів буде для друкованих документів і так стабільно високою. Тому причини платити більше за одну з цих програм, коли є рішення, вбудоване в пакет Office - вельми туманні. Інша справа, якщо ви маєте справу з окремими випадками. Наприклад, у вас є багато відсканованих в поганій якості документів, які потрібно оцифрувати і підготувати для режиму редагування. Тоді вузькоспеціалізований софт, налаштований під роботу з шумом і спотвореннями в таких зображеннях, зрозуміло, буде передбачувано краще. Він точніше обробить лист з символами, коректніше розпізнає їх і передасть в Word для подальшої роботи. Але таких випадків не так вже й багато і, як правило, пересічний користувач з ними не стикається. Тому для типових задач цей шлях вже практично не використовується.

Післямова

Пакет Office являє собою широкий набір інструментів для вирішення найрізноманітніших завдань. У кожної з вхідних в нього програм є своя функціональність, і вони доповнюють один одного при виконанні офісних робіт.Зокрема, для редагування відсканованих документів в Word потрібна програма розпізнавання, і в пакеті вона представлена. Така структура "Все-в-одному" дуже зручна, тому що не доводиться думати, де знайти і як встановити сторонній софт, не потрібно розбиратися з особливостями його інтерфейсу: є рішення, виконані в єдиному стилі. Тому Office був і залишається стандартом де-факто для офісної роботи.

Що ж стосується можливості вставити зображення безпосередньо в Word і редагувати його прямо звідти, то поки що такий режим не підтримується. Однак з огляду на тенденції на об'єднання програм усередині пакета і догляд в онлайн (ми маємо на увазі Office365), варто цього незабаром чекати. Зараз же потрібно буде встановити необхідний компонент (якщо він ще не був встановлений) і працювати саме так.