howto
無料OCRでスキャンしたPDFを検索可能にする
スキャンしたPDFはただの画像であり、検索したりテキストを選択したりできません。OCRツールは見えないテキストレイヤーを追加し、検索、コピー、ハイライトを可能にします。この無料OCRは、ブラウザ内で画像をテキストに変換します。
仕組み
OCR(光学式文字認識)は画像の各文字を分析し、実際のテキストに変換します。pdfjugglerはオープンソースのTesseract技術を使ってページをブラウザ内で処理するため、ファイルはプライベートのままです。
手順: 無料でスキャンしたPDFをOCRで検索可能にする
- OCRツールを開き、PDFを選択をクリックします。
- 精度を高めるために文書の言語を選びます。
- ファイルをアップロードし、ブラウザに見えないテキストレイヤーを作成させます。
- 処理が終わったら、ダウンロードを押して検索可能なPDFを保存します。
- OCRが機能したか確認するために検索やテキストのコピーを試します。
ヒント
SmallpdfやiLovePDFと異なり、pdfjugglerはオープンソースのTesseractを使ってブラウザ内で直接OCRを実行します。これらのサービスはページをクラウドにアップロードし、無料利用を制限することがよくあります。
OCRは古いスキャン文書をすぐに検索可能で利用しやすくします。pdfjugglerでアーカイブを蘇らせ、続いて整理と回転のガイドでページを整えたり、PDFにオンラインで署名する方法を学びましょう。
さらにPDFに関するヘルプが必要な場合は、完全ツールキットガイドをご覧いただくか、ページ管理にはPDF分割ツールをお試しください。
FAQ
OCRツールはどの言語をサポートしていますか?
Tesseract を使用し、数十の言語をサポートします。文書に合う言語を選んでください。
OCRは元のレイアウトを変更しますか?
いいえ、元の画像を保ったまま、見えないテキストレイヤーを追加します。
複数のPDFを一度にOCRできますか?
一度に1ファイルずつ処理し、結果を結合ツールでまとめてください。
OCRツールは手書きを認識できますか?
印刷された文字向けに設計されているため、手書きはうまく認識されない場合があります。
pdfjugglerは安全ですか?
はい、処理はブラウザ内で行われるため、ファイルがデバイスを離れることはありません。
オフラインで使用できますか?
はい、一度読み込めばインターネット接続がなくても動作します。