検索

howto

無料OCRでスキャンしたPDFを検索可能にする

スキャンしたPDFはただの画像であり、検索したりテキストを選択したりできません。OCRツールは見えないテキストレイヤーを追加し、検索、コピー、ハイライトを可能にします。この無料OCRは、ブラウザ内で画像をテキストに変換します。

仕組み

OCR(光学式文字認識)は画像の各文字を分析し、実際のテキストに変換します。pdfjugglerはオープンソースのTesseract技術を使ってページをブラウザ内で処理するため、ファイルはプライベートのままです。

手順: 無料でスキャンしたPDFをOCRで検索可能にする

  1. OCRツールを開き、PDFを選択をクリックします。
  2. 精度を高めるために文書の言語を選びます。
  3. ファイルをアップロードし、ブラウザに見えないテキストレイヤーを作成させます。
  4. 処理が終わったら、ダウンロードを押して検索可能なPDFを保存します。
  5. OCRが機能したか確認するために検索やテキストのコピーを試します。

ヒント

  • 最良の結果には高解像度のスキャンを使用してください。
  • スキャンが大きい場合は圧縮ツールと組み合わせます。
  • 先に向きを直す必要がありますか? 回転ツールを試してください。

SmallpdfやiLovePDFと異なり、pdfjugglerはオープンソースのTesseractを使ってブラウザ内で直接OCRを実行します。これらのサービスはページをクラウドにアップロードし、無料利用を制限することがよくあります。

OCRは古いスキャン文書をすぐに検索可能で利用しやすくします。pdfjugglerでアーカイブを蘇らせ、続いて整理と回転のガイドでページを整えたり、PDFにオンラインで署名する方法を学びましょう。

さらにPDFに関するヘルプが必要な場合は、完全ツールキットガイドをご覧いただくか、ページ管理にはPDF分割ツールをお試しください。

FAQ

OCRツールはどの言語をサポートしていますか?

Tesseract を使用し、数十の言語をサポートします。文書に合う言語を選んでください。

OCRは元のレイアウトを変更しますか?

いいえ、元の画像を保ったまま、見えないテキストレイヤーを追加します。

複数のPDFを一度にOCRできますか?

一度に1ファイルずつ処理し、結果を結合ツールでまとめてください。

OCRツールは手書きを認識できますか?

印刷された文字向けに設計されているため、手書きはうまく認識されない場合があります。

pdfjugglerは安全ですか?

はい、処理はブラウザ内で行われるため、ファイルがデバイスを離れることはありません。

オフラインで使用できますか?

はい、一度読み込めばインターネット接続がなくても動作します。