howto
스캔 PDF를 검색 가능하게 만드는 방법 (무료 단계별 가이드)
스캔 PDF를 검색 가능하게 만드는 방법 (무료 단계별 가이드)
예전에는 광학 문자 인식(OCR)을 쓰려면 값비싼 데스크톱 라이선스가 필요했습니다. 이제 pdfjuggler만 있으면 "무료 OCR"과 "업로드 없는 보안 처리"를 동시에 누리며 스캔 PDF를 검색 가능하게 바꿀 수 있습니다. Adobe 없이도 검색, 복사, 하이라이트, 접근성을 즉시 향상시키고 마지막에는 PDF 압축으로 파일 용량까지 줄이세요. OCR PDF 도구는 모든 과정을 브라우저 안에서 처리하므로 민감한 문서도 기기 밖으로 나가지 않습니다.
사전 준비물:
- 변환 권한이 있는 스캔 PDF 또는 다중 페이지 이미지 문서.
- JavaScript가 켜져 있는 Chromium, Firefox, Safari, Edge 등 데스크톱·모바일 브라우저.
- 선택 도구: PDF 회전, PDF 정리, PDF 분할.
예상 소요 시간: 20페이지 문서는 10~15분 정도(스캔 보정 시간이 추가될 수 있음).
난이도: 선명한 스캔은 쉬움, 기울어지거나 다국어가 섞인 경우는 중간 수준.
단계별 안내
-
OCR PDF 도구를 열고 요구 사항을 확인한다
OCR PDF 워크스페이스를 방문합니다. 작은 글자, 도장, 혼합 언어가 있는 페이지를 훑어보고 페이지 수를 메모해 두세요. 혹시 모를 재시도를 대비해 원본 사본을 보관합니다.
-
정확도를 높이도록 스캔을 정리한다
기울어진 페이지는 회전시키고 빈 페이지 삭제나 순서 정렬은 PDF 정리에서 처리합니다. 색이 옅다면 재스캔하거나 밝기를 조정하고, 용량이 크면 PDF 압축 또는 PDF 분할로 나눠 보세요.
-
클라우드 없이 안전하게 PDF를 불러온다
파일을 드래그 앤 드롭하거나 PDF 선택을 눌러 추가합니다. 인식은 WebAssembly와 Tesseract로 로컬에서 진행되어 외부로 전송되지 않습니다. 썸네일이 정확한지 확인한 뒤 다음 단계로 이동하세요.
-
OCR 언어와 레이아웃 옵션을 설정한다
기본 언어와 필요한 보조 언어 팩을 선택합니다. 자동 회전이나 기울임 보정을 켜고, 표가 많다면 레이아웃 유지 옵션을 활성화하세요. 이메일로 보내려면 이 단계에서 압축을, 보관용이라면 원본 품질을 유지합니다.
-
OCR를 실행하고 진행 상황을 지켜본다
OCR 시작을 클릭하고 진행 막대를 살핍니다. 경고가 나타나면 2단계로 돌아가 조정하고, 메모리가 적은 기기에서는 모든 페이지에 초록색 체크가 뜰 때까지 탭을 유지하세요.
-
검색 가능한 PDF를 저장하고 검증·공유한다
완성된 PDF를 내려받아 파일명에
_ocr를 붙입니다. 검색과 복사·붙여넣기 기능을 시험하고, 용량이 커졌다면 PDF 압축을 다시 활용하세요. 원본과 변환본을 모두 보관하고, 공유 시 검색과 접근성 준비가 끝났음을 알려 줍니다.
문제 해결 및 대안
- 문자가 뒤섞여 보인다. 스캔 해상도를 높이고 대비를 강화한 뒤 다시 OCR을 실행하거나, 파일을 더 짧은 묶음으로 나눠 처리하세요.
- 대용량에서 멈춘다. PDF 분할로 나눈 뒤 PDF 합치기로 결과를 다시 모읍니다.
- 텍스트만 추출하고 싶다. 내보낸 후 PDF 정리에서 필요한 페이지만 추출하거나, 검색 가능한 PDF에서 직접 복사합니다.
- 민감한 정보를 다룬다. 모든 처리가 로컬에서 이루어진다는 점을 기록하고, 배포 전에 비식별 가이드를 함께 참고하세요.
공유 전 최종 체크리스트
- 숫자를 포함한 세 가지 구문을 검색해 텍스트 레이어가 작동하는지 확인.
- 200% 확대 후 표, 칼럼, 캡션이 흐트러지지 않았는지 살펴보기.
- 메타데이터와 파일명을 업데이트해 OCR 버전임을 명확히 표시.
- 원본과 변환본을 모두 백업 위치에 보관.
- 인수인계 메모에 검색 가능·접근성 준비 완료 사실을 명시.
더 효율적인 PDF 워크플로 살펴보기
- 1MB 이하로 압축하는 가이드나 PDF 압축 도구로 큰 스캔을 가볍게 만드세요.
- OCR 완료 문서를 PDF 합치기로 묶고, PDF 자동화 워크플로 가이드로 반복 작업을 줄이세요.
- OCR 후 주석이나 서명이 필요하면 PDF 전자 서명 가이드와 정리 & 회전 가이드를 참고하세요.
자주 묻는 질문
pdfjuggler의 OCR 도구는 정말 무료인가요?
네. 계정, 워터마크, 업로드 제한 없이 무제한으로 OCR을 실행할 수 있으며 모든 과정이 브라우저에서 진행됩니다.
어떤 언어와 문자를 지원하나요?
Tesseract 언어 팩이 다수 포함되어 있으며 다양한 문자 체계를 지원합니다. 4단계에서 기본 언어와 보조 언어를 선택하면 정확도가 높아집니다.
인터넷이 없어도 변환할 수 있나요?
가능합니다. 먼저 OCR PDF 도구를 온라인에서 한 번 열어 캐시하면, 이후에는 오프라인에서도 모든 단계를 완료할 수 있습니다.
OCR 후 용량을 줄이려면 어떻게 하나요?
OCR 실행 전 압축 토글을 켜거나, 내보낸 뒤 PDF 압축을 이용하세요. 두 방법 모두 검색 가능한 텍스트 레이어는 유지됩니다.
손글씨나 서명도 인식되나요?
인쇄된 글자에서 가장 좋은 결과를 얻습니다. 손글씨 메모는 이미지로 남기고, 별도 페이지에 요약을 입력하거나 검색 가능한 PDF와 원본을 함께 보관하는 것이 좋습니다.