OCR PDF – 스캔된 PDF를 검색 가능하게 만들기
무료광학 문자 인식(OCR)은 텍스트 이미지를 PDF 안의 실제 검색 가능한 텍스트로 바꿉니다.
OCR 작동 방식
1) 이미지 분석. 스캐너가 페이지를 캡처 → 픽셀 데이터. 밝음 = 배경; 어두움 = 텍스트/도형.
2) 전처리. 이미지 정리: 모서리 매끄럽게, 점 제거, 스캔 정렬, 선 정돈, 스크립트 감지.
3) 텍스트 인식. 특징 추출과 패턴 매칭으로 문자와 단어를 식별합니다.
4) 후처리. 인식된 텍스트를 보이지 않는 레이어로 추가하거나 일반 텍스트로 내보냅니다.
공유하다:
자주 묻는 질문
OCR이란 무엇인가요?
OCR(광학 문자 인식)은 텍스트 이미지를 PDF 안의 검색 가능하고 기계가 읽을 수 있는 텍스트로 변환합니다.
PDF 모양은 그대로 유지되나요?
예. 원래 페이지 내용을 유지하고 보이지 않는 텍스트 레이어를 겹쳐서 외관은 동일하지만 텍스트를 선택하고 검색할 수 있습니다.
모바일에서도 작동하나요?
예. 인터페이스는 터치에 친화적이며 최신 모바일 브라우저에서 작동합니다.
내 파일은 비공개인가요?
인식은 브라우저에서 실행됩니다. 파일은 서버에 저장되지 않습니다.
큰 PDF를 OCR하는 데 얼마나 걸리나요?
OCR 속도는 페이지 수와 언어에 따라 다릅니다. 100페이지 스캔을 검색 가능하게 만드는 데는 현대식 노트북 기준으로 보통 1분이 채 걸리지 않습니다.