howto

Näin teet skannatusta PDF:stä haettavan (vaihe vaiheelta)

Published 3. lokakuuta 2025

By Reid Nakamura, Privacy Research Lead

Näin teet skannatusta PDF:stä haettavan (vaihe vaiheelta)

Optinen tekstintunnistus (OCR) kuului aiemmin vain kalliisiin työpöytälisensseihin. pdfjugglerin avulla voit tehdä skannatusta PDF:stä haettavan ilman Adobea, ilman latauksia ja ilman raskaita asennuksia. OCR mahdollistaa välittömän haun, luotettavan kopioinnin ja pienemmät arkistot, kun viimeistelet työn Pakkaa PDF -työkalulla. OCR PDF -työkalu toimii kokonaan selaimessa, joten luottamukselliset tiedostot pysyvät laitteellasi myös offline-tilassa.

Edellytykset ja materiaalit:

Skannattu PDF tai kuvasivuista koostuva asiakirja, jonka muuntamiseen sinulla on lupa.
Chromium-, Firefox-, Safari- tai Edge-selain, jossa JavaScript on käytössä työpöydällä tai mobiilissa.
Vapaaehtoiset apurit: Käännä PDF, Järjestä PDF tai Jaa PDF.

Arvioitu aika: 10–15 minuuttia 20-sivuiselle asiakirjalle, lisäksi valmisteluaikaa, jos skannit ovat haastavia.

Vaikeustaso: Helppo selkeille skanneille; keskitasoinen, jos sivut ovat vinoja tai monikielisiä.

Vaiheittaiset ohjeet

Avaa OCR PDF -työkalu ja vahvista asiakirjan vaatimukset

Siirry OCR-työtilaan. Selaa skannausta löytääksesi pienen tekstin, leimat tai sekaisin olevat kielet. Säilytä koskematon kopio siltä varalta, että aloitat uudelleen, ja kirjaa sivumäärä etenemisen seuraamiseksi.
Valmistele skannaus parhaan mahdollisen OCR-tarkkuuden varmistamiseksi

Käännä vinoja sivuja, poista tyhjät arkit ja järjestä osiot Järjestä PDF -työkalulla. Skannaa uudelleen tai säädä kirkkautta, jos sivut ovat haalistuneet, ja pienennä suuria tiedostoja Pakkaa PDF -työkalulla tai jaa ne Jaa PDF -toiminnolla.
Lataa skannattu PDF turvallisesti ilman pilvitallennusta

Pudota tiedosto työkaluun tai napsauta Valitse PDF. Tunnistus tapahtuu paikallisesti WebAssemblyn ja Tesseractin avulla, joten kukaan muu ei näe tietojasi. Varmista esikatselukuvat ennen etenemistä.
Valitse kieli, asettelu ja optimointiasetukset

Valitse pääkieli ja tarvittaessa lisäpaketit. Ota automaattinen kierto tai oikaisu käyttöön vinoille sivuille ja pidä asettelun säilyttäminen päällä taulukoita varten. Päätä pakkaatko nyt (hyvä sähköpostia varten) vai säilytätkö täyden laadun arkistointia varten.
Käynnistä OCR-prosessi ja seuraa etenemistä

Napsauta Käynnistä OCR. Tarkkaile etenemispalkkia ja ratkaise varoitukset palaamalla vaiheeseen 2. Pidä välilehti aktiivisena laitteilla, joissa on vähän muistia, kunnes jokaisella sivulla on vihreä merkki.
Lataa, tarkista ja jaa haettava PDF

Lataa valmis PDF, nimeä se uudelleen lisäämällä _ocr ja testaa haku sekä kopioi ja liitä -toiminto. Jos tiedosto kasvaa, suorita se Pakkaa PDF -työkalussa. Säilytä molemmat versiot ja kerro tiimille, että asiakirja on nyt haettavissa, korostettavissa ja ruudunlukijoiden luettavissa.

Vianetsintä ja vaihtoehdot

Teksti on edelleen epäselvää. Nosta skannauksen resoluutiota, lisää kontrastia tai jaa tiedosto lyhyempiin osiin ennen uutta yritystä.
Käsittely pysähtyy suuriin kokonaisuuksiin. Työstä aineisto erissä Jaa PDF -toiminnolla ja yhdistä tulokset Yhdistä PDF -työkalulla.
Tarvitset vain pelkän tekstin. Avaan viennin jälkeen Järjestä PDF -työkalun poimiaksesi tärkeät sivut tai kopioi teksti suoraan säilyttäen haettavan PDF:n viitteenä.
Luottamukselliset tiedot. Kirjaa, että kaikki tapahtuu paikallisesti, ja yhdistä tämä prosessi turvallisen sensuroinnin oppaaseen ennen jakelua.

Viimeinen tarkistuslista ennen jakamista

Hae kolme ilmausta – myös numeroita – varmistaaksesi tekstikerroksen toimivuuden.
Zoomaa 200 %:iin ja varmista, että taulukot, sarakkeet ja kuvatekstit ovat linjassa.
Päivitä metatiedot ja tiedostonimi, jotta OCR-versio erottuu.
Arkistoi sekä alkuperäinen että muunnettu PDF varmuuskopiojärjestelmääsi.
Kirjaa luovutusmuistiinpanoihin, että tiedosto on haettava ja saavutettava.

Jatka tehokkaiden PDF-työnkulkujen tutkimista

Kevennä raskaita skannauksia oppaalla Pakkaa PDF alle 1 MB tai suoraan Pakkaa PDF -työkalulla.
Yhdistä OCR-osuudet Yhdistä PDF -työkalulla ja tehosta työskentelyä PDF-automaation oppaalla.
Tarvitsetko merkintöjä tai allekirjoituksia OCR:n jälkeen? Seuraa Allekirjoita PDF -opasta tai siisti asettelua Järjestä & Käännä -oppaalla.

Usein kysytyt kysymykset

Onko pdfjugglerin OCR-työkalu todella maksuton?

Kyllä. Voit tehdä rajattomasti OCR-muunnoksia ilman tiliä, vesileimaa tai latausrajoja, koska kaikki tapahtuu omassa selaimessasi.

Mitä kieliä ja kirjoitusjärjestelmiä tuetaan?

Työkalu sisältää Tesseractin kielipaketteja, jotka kattavat kymmeniä kirjoitusjärjestelmiä. Valitse pääkieli – ja tarvittaessa lisäpaketit – vaiheessa 4 parhaan tarkkuuden saavuttamiseksi.

Voinko muuntaa tiedostoja ilman internet-yhteyttä?

Ehdottomasti. Lataa OCR PDF -työkalu kerran verkossa, jotta se välimuistitetaan. Sen jälkeen voit avata välilehden uudelleen ja suorittaa kaikki vaiheet offline-tilassa.

Miten pidän tiedostokoon kurissa OCR:n jälkeen?

Ota pakkaus käyttöön ennen aloitusta tai aja viety tiedosto Pakkaa PDF -työkalun kautta. Molemmat vaihtoehdot säilyttävät haettavan tekstikerroksen.

Entä käsin kirjoitetut merkinnät tai allekirjoitukset?

Painettu teksti tuottaa parhaat tulokset. Käsinkirjoitetut muistiinpanot jäävät kuvamuotoon, joten harkitse yhteenvedon kirjoittamista erilliselle sivulle tai liitä alkuperäinen skannaus haettavan PDF:n rinnalle kontekstin vuoksi.