howto

स्कैन किए गए PDF को खोजयोग्य बनाएं (कदम-दर-कदम मार्गदर्शिका)

Published 3 अक्टूबर 2025

By Reid Nakamura, Privacy Research Lead

स्कैन किए गए PDF को खोजयोग्य बनाएं (कदम-दर-कदम मार्गदर्शिका)

पहले OCR (ऑप्टिकल कैरेक्टर रिकग्निशन) केवल महंगे डेस्कटॉप लाइसेंस पर चलता था। pdfjuggler के साथ आप बिना Adobe, बिना अपलोड और बिना भारी इंस्टॉल के स्कैन किए गए PDF को खोजयोग्य बना सकते हैं। OCR जोड़ने से तुरंत खोज, भरोसेमंद कॉपी-पेस्ट और Compress PDF से अंतिम चरण में छोटे आर्काइव मिलते हैं। OCR PDF टूल पूरा वर्कफ़्लो सीधे आपके ब्राउज़र में चलाता है, इसलिए गोपनीय फ़ाइलें ऑफ़लाइन रहते हुए भी डिवाइस पर सुरक्षित रहती हैं।

पूर्वापेक्षाएँ और सामग्री:

वह स्कैन किया हुआ PDF या मल्टी-पेज इमेज दस्तावेज़ जिसे बदलने की अनुमति आपके पास है।
Chromium, Firefox, Safari या Edge—डेस्कटॉप या मोबाइल—जहाँ JavaScript सक्षम हो।
वैकल्पिक सहायक: Rotate PDF, Organize PDF या Split PDF।

अनुमानित समय: १०–१५ मिनट (२० पृष्ठ के दस्तावेज़ के लिए), साथ में तैयारी का समय यदि स्कैन उलझे हों।

कठिनाई स्तर: साफ़ स्कैन के लिए आसान; तिरछे या बहुभाषी पन्नों पर मध्यम।

चरण-दर-चरण निर्देश

OCR PDF टूल खोलें और दस्तावेज़ की आवश्यकताएँ जाँचें

OCR PDF कार्यक्षेत्र पर जाएँ। स्कैन को सरसरी तौर पर पढ़ें ताकि छोटे पाठ, मोहरें या मिश्रित भाषाओं की स्थिति पता रहे। पुनः प्रयास के लिए मूल कॉपी सुरक्षित रखें और प्रगति पर नज़र रखने हेतु कुल पन्ने नोट करें।
बेहतर OCR सटीकता के लिए स्कैन तैयार करें

तिरछे पन्ने घुमाएँ, खाली पेज हटाएँ और अनुभागों को Organize PDF से क्रम में रखें। पन्ने फीके दिखें तो पुनः स्कैन करें या चमक समायोजित करें, और बड़ी फ़ाइलों का आकार Compress PDF या Split PDF के जरिये घटाएँ।
क्लाउड पर भेजे बिना सुरक्षित रूप से स्कैन किया PDF अपलोड करें

फ़ाइल को टूल में खींचें या Select PDF टैप करें। पहचान WebAssembly और Tesseract के ज़रिये लोकली चलती है, इसलिए आपका डेटा किसी अन्य के पास नहीं जाता। आगे बढ़ने से पहले थंबनेल सही दिख रहे हों इसकी पुष्टि करें।
OCR भाषा, लेआउट और ऑप्टिमाइज़ेशन सेटिंग चुनें

मुख्य भाषा और जरूरत हो तो अतिरिक्त पैक चुनें। टेढ़े पन्नों के लिए ऑटो-रोटेट या डेस्क्यू सक्षम रखें और तालिकाओं के लिए लेआउट संरक्षित रखें। तय करें कि अभी संपीड़न करना बेहतर है (ईमेल के लिए) या संग्रह हेतु पूर्ण गुणवत्ता संभाल कर रखें।
OCR प्रक्रिया चलाएँ और प्रगति पर नज़र रखें

Start OCR पर क्लिक करें। प्रगति पट्टी पर ध्यान दें और चेतावनी दिखे तो चरण २ पर लौटकर सुधार करें। कम मेमोरी वाले उपकरण पर टैब खुला रखें जब तक हर पेज पर हरे टिक का निशान न आ जाए।
खोजयोग्य PDF डाउनलोड, जाँच और साझा करें

तैयार PDF डाउनलोड करें, नाम में ‎_ocr जोड़ें और खोज व कॉपी-पेस्ट फ़ीचर परखें। फ़ाइल का आकार बढ़े तो Compress PDF से संपीड़ित करें। मूल और रूपांतरित दोनों संस्करण सुरक्षित रखें और टीम को बताएं कि दस्तावेज़ अब खोज तथा स्क्रीन रीडर के अनुकूल है।

समस्या निवारण और विकल्प

पाठ अभी भी गड़बड़ दिखता है। स्कैन का रेज़ॉल्यूशन बढ़ाएँ, कंट्रास्ट तेज करें या फ़ाइल को छोटे भागों में बाँटकर फिर से प्रोसेस करें।
विशाल संग्रह पर प्रोसेस रुक जाता है। काम को Split PDF से बैच में बाँटें और आउटपुट को Merge PDF से जोड़ें।
केवल पाठ चाहिए। निर्यात के बाद Organize PDF खोलकर ज़रूरी पेज निकालें या खोजयोग्य फ़ाइल को संदर्भ रखते हुए सीधे पाठ कॉपी करें।
संवेदनशील जानकारी संभालनी है। सुनिश्चित करें कि प्रोसेस लोकली हो रहा है और साझा करने से पहले इसे रेडैक्शन गाइड के साथ जोड़ें।

साझा करने से पहले अंतिम चेकलिस्ट

तीन वाक्य—संख्याएँ सहित—खोजें ताकि पाठ परत सक्रिय होने की पुष्टि हो।
२००% ज़ूम करके देखें कि तालिकाएँ, कॉलम और कैप्शन ठीक से पंक्तिबद्ध हैं या नहीं।
मेटाडेटा और फ़ाइल नाम अपडेट करें ताकि टीम को OCR संस्करण पहचानने में आसानी हो।
मूल और परिवर्तित दोनों PDF अपने बैकअप स्थान पर संग्रहित करें।
हैंडऑफ़ नोट्स में उल्लेख करें कि फ़ाइल खोजयोग्य है और एक्सेसिबिलिटी-रेडी है।

कुशल PDF वर्कफ़्लो को और जानें

बड़े स्कैन हल्के करने के लिए Compress PDF under 1 MB गाइड या सीधे Compress PDF टूल का उपयोग करें।
OCR किए गए हिस्सों को Merge PDF से जोड़ें और PDF automation वर्कफ़्लो गाइड से आगे की प्रक्रियाएँ सरल करें।
OCR के बाद एनोटेशन या सिग्नेचर चाहिए? Sign PDF मार्गदर्शिका अपनाएँ या लेआउट सुधारने के लिए Organize & Rotate गाइड देखें।

अक्सर पूछे जाने वाले प्रश्न

क्या pdfjuggler का OCR टूल वास्तव में मुफ्त है?

हाँ। सब कुछ ब्राउज़र में चलता है, इसलिए बिना अकाउंट, बिना वॉटरमार्क और बिना अपलोड सीमा के असीमित रूपांतरण किए जा सकते हैं।

कौन-सी भाषाएँ और लिपियाँ समर्थित हैं?

टूल में Tesseract भाषा पैक शामिल हैं जो दर्जनों लिपियों को कवर करते हैं। चरण ४ में प्राथमिक और ज़रूरत पड़ने पर द्वितीयक भाषा चुनें ताकि सटीकता बेहतर रहे।

क्या मैं बिना इंटरनेट के फ़ाइलें बदल सकता हूँ?

बिलकुल। OCR PDF टूल को एक बार ऑनलाइन लोड करें ताकि कैश हो जाए। बाद में टैब दोबारा खोलें और हर चरण ऑफ़लाइन पूरा करें।

OCR के बाद फ़ाइल का आकार कैसे नियंत्रित रखें?

OCR शुरू करने से पहले संपीड़न विकल्प सक्षम करें या निर्यात फ़ाइल को Compress PDF में भेजें। दोनों विकल्प खोजयोग्य पाठ परत सुरक्षित रखते हैं।

हस्तलिखित नोट्स या हस्ताक्षरों का क्या?

मुद्रित पाठ सबसे अच्छा रूपांतरित होता है। हस्तलिखित नोट्स चित्र रूप में रहते हैं, इसलिए अलग पन्ने पर सार लिखें या संदर्भ के लिए मूल स्कैन के साथ खोजयोग्य PDF साझा करें।