howto
Jak uczynić zeskanowane PDF-y przeszukiwalnymi (krok po kroku)
Jak uczynić zeskanowane PDF-y przeszukiwalnymi (krok po kroku)
Optical Character Recognition (OCR) kiedyś wymagał drogich licencji. Dzięki pdfjuggler sprawisz, że zeskanowany PDF będzie przeszukiwalny bez Adobe, bez wysyłania plików i bez ciężkich instalacji. Po OCR zyskujesz natychmiastowe wyszukiwanie, pewne kopiowanie i mniejsze archiwa, gdy na końcu sięgniesz po Kompresuj PDF. Narzędzie OCR PDF działa w całości w przeglądarce, więc poufne pliki zostają na urządzeniu nawet offline.
Wymagania i materiały:
- Zeskanowany PDF lub wielostronicowy obraz, do którego masz prawa.
- Chromium, Firefox, Safari albo Edge z włączonym JavaScriptem na komputerze lub telefonie.
- Opcjonalne wsparcie: Obróć PDF, Organizuj PDF lub Podziel PDF.
Szacowany czas: 10–15 minut dla dokumentu 20-stronicowego plus przygotowanie przy gorszych skanach.
Poziom trudności: Łatwy dla wyraźnych skanów, średni przy przekrzywionych lub wielojęzycznych stronach.
Instrukcja krok po kroku
-
Otwórz narzędzie OCR i sprawdź wymagania dokumentu
Wejdź do przestrzeni roboczej OCR. Przejrzyj skan, żeby wiedzieć, gdzie znajdują się drobne napisy, pieczątki lub mieszane języki. Zrób kopię zapasową i zanotuj liczbę stron, aby śledzić postęp.
-
Przygotuj skan, aby zwiększyć dokładność OCR
Wyprostuj przechylone strony, usuń puste kartki i uporządkuj sekcje w Organizuj PDF. Jeśli strony są blade, zeskanuj je ponownie lub zwiększ jasność, a ogromne pliki pomniejsz przez Kompresuj PDF albo podziel w Podziel PDF.
-
Prześlij zeskanowany PDF bezpiecznie i bez chmury
Przeciągnij plik do narzędzia lub kliknij Wybierz PDF. Rozpoznawanie działa lokalnie dzięki WebAssembly i Tesseract, więc nikt nie zobaczy twoich danych. Upewnij się, że miniatury wyglądają poprawnie.
-
Ustaw język OCR, układ i optymalizację
Wybierz główny język oraz ewentualne pakiety dodatkowe. Włącz automatyczne obracanie lub prostowanie dla krzywych stron i pozostaw zachowanie układu, jeśli masz tabele. Zdecyduj, czy włączasz kompresję (dobrą do e-maili), czy zachowujesz pełną jakość na archiwum.
-
Uruchom OCR i obserwuj postęp
Kliknij Start OCR. Obserwuj pasek postępu i reaguj na ostrzeżenia, wracając do kroku 2. Na urządzeniach z mniejszą pamięcią trzymaj kartę aktywną, aż każda strona pokaże zielony znacznik.
-
Pobierz, zweryfikuj i udostępnij przeszukiwalny PDF
Pobierz gotowy PDF, dodaj w nazwie
_ocri przetestuj wyszukiwanie oraz kopiowanie. Jeśli plik urósł, ponownie przepuść go przez Kompresuj PDF. Zarchiwizuj obie wersje i poinformuj zespół, że dokument jest przeszukiwalny oraz dostępny dla czytników ekranu.
Rozwiązywanie problemów i alternatywy
- Tekst nadal jest zniekształcony. Podnieś rozdzielczość skanu, zwiększ kontrast albo podziel plik na mniejsze partie i powtórz kroki.
- Przetwarzanie zatrzymuje się przy dużych archiwach. Podziel materiał w Podziel PDF i połącz wyniki w Scal PDF.
- Potrzebujesz tylko samego tekstu. Po eksporcie otwórz Organizuj PDF, aby wyciągnąć kluczowe strony, albo skopiuj tekst, pozostawiając przeszukiwalny PDF jako odniesienie.
- Dokument zawiera dane wrażliwe. Zapisz, że proces odbywa się lokalnie, i połącz ten schemat z poradnikiem anonimizacji przed udostępnieniem.
Lista kontrolna przed udostępnieniem
- Wyszukaj trzy hasła – w tym liczby – żeby potwierdzić działającą warstwę tekstową.
- Powiększ do 200%, by sprawdzić, czy tabele, kolumny i podpisy pozostają wyrównane.
- Zaktualizuj metadane oraz nazwę pliku, aby zespół od razu rozpoznał wersję po OCR.
- Zarchiwizuj oryginał i wersję z OCR w swoim miejscu kopii zapasowych.
- W notatkach przekazania dopisz, że plik jest przeszukiwalny i gotowy do dostępności.
Odkryj kolejne sprytne sposoby pracy z PDF
- Odchudź duże skany dzięki poradnikowi kompresji poniżej 1 MB albo skorzystaj z narzędzia Kompresuj PDF.
- Łącz sekcje po OCR w Scal PDF i automatyzuj zadania z pomocą przewodnika po automatyzacji PDF.
- Potrzebujesz adnotacji lub podpisów po OCR? Przejdź do poradnika podpisywania PDF online lub uporządkuj układ w przewodniku Organizuj i Obracaj.
Najczęściej zadawane pytania
Czy narzędzie OCR pdfjuggler naprawdę jest darmowe?
Tak. Możesz wykonywać dowolną liczbę konwersji – bez kont, znaków wodnych i limitów przesyłania, bo wszystko dzieje się w przeglądarce.
Jakie języki i zestawy znaków są obsługiwane?
Narzędzie zawiera pakiety językowe Tesseract dla dziesiątek alfabetów. W kroku 4 wybierz język główny i opcjonalne dodatkowe, by zwiększyć dokładność.
Czy mogę konwertować pliki bez internetu?
Jak najbardziej. Wczytaj narzędzie OCR PDF raz online, aby zapisać je w pamięci podręcznej. Później możesz ponownie otworzyć kartę i wykonać wszystkie kroki offline.
Jak utrzymać niewielki rozmiar pliku po OCR?
Włącz kompresję przed uruchomieniem OCR albo przepuść wyeksportowany dokument przez Kompresuj PDF. Obie metody zachowują warstwę tekstową.
Co z pismem odręcznym lub podpisami?
Najlepiej rozpoznawany jest drukowany tekst. Pismo odręczne pozostanie obrazem, więc przygotuj streszczenie na osobnej stronie lub dołącz oryginalny skan jako uzupełnienie.