Haku

OCR PDF – tee skannatuista PDF-tiedostoista haettavia

Optinen tekstintunnistus (OCR) muuttaa tekstikuvat oikeaksi, haettavaksi tekstiksi PDF:ssä.

Kuinka OCR toimii

1) Kuvan analyysi. Skanneri tallentaa sivun → pikselitiedot. Kirkas = tausta; tumma = teksti/kuviot.

2) Esikäsittely. Puhdista kuva: tasoita reunat, poista roskat, suorista skannaukset, siisti viivat, tunnista kirjoitukset.

3) Tekstin tunnistus. Piirteiden erottelu ja kuvioiden sovitus tunnistavat merkit ja sanat.

4) Jälkikäsittely. Lisää tunnistettu teksti näkymättömänä kerroksena tai vie pelkkänä tekstinä.

Jakaa:

Usein kysytyt kysymykset

Mikä on OCR?

OCR (optinen tekstintunnistus) muuttaa tekstikuvat haettavaksi, koneella luettavaksi tekstiksi PDF:ssä.

Näyttääkö PDF:ni samalta?

Kyllä. Säilytämme alkuperäisen sivusisällön ja lisäämme näkymättömän tekstikerroksen, jolloin ulkoasu säilyy mutta teksti on valittavissa ja haettavissa.

Toimiiko tämä mobiilissa?

Kyllä. Käyttöliittymä on kosketusystävällinen ja toimii nykyaikaisissa mobiiliselaimissa.

Onko tiedostoni yksityinen?

Tunnistus suoritetaan selaimessasi. Tiedostoja ei tallenneta palvelimillemme.

Kuinka kauan OCR kestää suurille PDF-tiedostoille?

OCR:n nopeus riippuu sivumäärästä ja kielestä. 100-sivuisen skannauksen muuttaminen haettavaksi kestää yleensä alle minuutin nykyaikaisella kannettavalla.