Working with scanned TIFF files

From WikiVirgo

Jump to: navigation, search

by Dmytro Iakubovskyi

Для того, чтобы перевести сканированный текст (в частности, в формате TIFF), в единый PDF файл, удобно использовать следующую процедуру.

  • На компьютере virgo1 в ВИРГО классе ИТФ Денисом Савченко установлена программа scantailor, которая позволяет чистить и выравнивать сканированные файлы, делает автоматическую разбивку страниц и имеет много других полезных функций. Каждая страница при этом сохраняется в виде отдельного файла. ВАЖНО: По умолчанию устанавливается флаг "Despeckle", который надо отключить для всех страниц, иначе в формулах будут потеряны знаки "-", запятые, точки, и прочие важные мелочи.
  • Полученные файлы соединяются в один TIFF файл при помощи процедуры tiffcp. При этом, новые страницы можно добавлять в конец файла, например, так: tiffcp -a inputs*.tiff output.tiff
  • Полученный TIFF файл переводится в PDF при помощи процедуры tiff2pdf. Пример: tiff2pdf output.tiff > output.pdf
Personal tools