Adobe Acrobatでページのテキスト認識(OCR)を行う場合に「ClearScan」という形式を利用することができます。 ClearScanとは、Adobeの説明をそのまま引用すると「元のフォントに似た新しい Type 3 フォントを合成し、低解像度のコピーを使用してページの背景を保持します」というもので、以下のようなメリットがあります。 ClearScanによるテキスト認識のメリット 拡大・縮小を行っても文字がクリアに表示できる PDFのファイルサイズをかなり小さくできる しかし、一方でClearScanには以下のような問題点もあります。 ClearScanによるテキスト認識の問題点 処理に時間がかかる 処理してる間は放置しておけばいいので、それほど問題にはならないですが。 文字やページ全体が傾くことがある あまり極端に傾くことはないみたいですが、以下のように微妙に傾きます。(著