howto
كيفية جعل ملفات PDF الممسوحة ضوئيًا قابلة للبحث (خطوة بخطوة)
كيفية جعل ملفات PDF الممسوحة ضوئيًا قابلة للبحث (خطوة بخطوة)
كان التعرف الضوئي على الحروف (OCR) مرتبطًا سابقًا بتراخيص مكتبية باهظة. مع pdfjuggler يمكنك جعل ملف PDF ممسوح ضوئيًا قابلًا للبحث دون Adobe، ودون رفع، ودون تثبيتات معقدة. تضيف طبقة OCR القدرة على البحث الفوري، والنسخ الموثوق، وأرشيفات أصغر عندما تنهي العمل باستخدام ضغط PDF. تعمل أداة OCR PDF بالكامل في متصفحك، لذا تبقى الملفات السرية على جهازك حتى عند العمل دون اتصال.
المتطلبات المسبقة والمواد:
- ملف PDF ممسوح ضوئيًا أو مستند صور متعدد الصفحات لديك صلاحية معالجته.
- متصفح Chromium أو Firefox أو Safari أو Edge مع JavaScript مفعّل على الحاسوب أو الهاتف.
- أدوات اختيارية: تدوير PDF، تنظيم PDF، أو تقسيم PDF.
الوقت المقدر: ١٠–١٥ دقيقة لمستند من ٢٠ صفحة، مع وقت إضافي للتحضير إذا كانت المسوحات غير واضحة.
الصعوبة: سهلة للمسوحات الواضحة؛ متوسطة عندما تكون الصفحات مائلة أو بلغات متعددة.
تعليمات خطوة بخطوة
-
افتح أداة OCR PDF وتحقق من متطلبات المستند
زر مساحة عمل OCR PDF. تصفّح المسح لتحديد مواضع النص الصغير أو الأختام أو اللغات المختلطة. احتفظ بنسخة غير معدّلة في حال احتجت للإعادة، ولاحظ عدد الصفحات لمتابعة التقدم.
-
حضّر المسح للحصول على أفضل دقة للتعرّف
قم بتدوير الصفحات المائلة، واحذف الصفحات الفارغة، وأعد ترتيب الأقسام باستخدام تنظيم PDF. أعد المسح أو عدّل السطوع إذا بدت الصفحات باهتة، وقلّص الملفات الضخمة عبر ضغط PDF أو قسّمها لأجزاء باستخدام تقسيم PDF.
-
حمّل ملف PDF الممسوح بأمان بدون تخزين سحابي
اسحب الملف إلى الأداة أو اضغط تحديد PDF. يعمل التعرف محليًا عبر WebAssembly وTesseract، لذا لا يمكن لأي جهة أخرى رؤية بياناتك. تأكد من أن المعاينات المصغرة تظهر بالشكل الصحيح قبل المتابعة.
-
اختر لغة OCR والتخطيط وإعدادات التحسين
حدّد اللغة الأساسية وحزم اللغات الثانوية عند الحاجة. فعّل التصحيح التلقائي للدوران أو الاستقامة للصفحات المائلة، وابقَ على حفظ التخطيط للجدول مفعّلًا. قرر ما إذا كنت ستضغط الملف الآن (مثالي للبريد) أو ستحافظ على الجودة الكاملة للأرشفة.
-
شغّل عملية OCR وتابع التقدّم
اضغط بدء OCR. راقب شريط التقدم وعالج أي تنبيهات بالعودة إلى الخطوة ٢. أبقِ التبويب مفتوحًا على الأجهزة ذات الذاكرة المحدودة حتى يظهر كل صفحة بعلامة تحقق خضراء.
-
حمّل ملف PDF القابل للبحث وتحقق منه ثم شاركه
نزّل ملف PDF النهائي، أعد تسميته بإضافة _ocr، واختبر البحث بالإضافة إلى النسخ واللصق. إذا زاد حجم الملف، مرره عبر ضغط PDF. خزّن النسخة الأصلية والمحوّلة، وأخبر فريقك أن المستند أصبح يدعم البحث، والتظليل، وقارئات الشاشة.
استكشاف الأخطاء والحلول البديلة
- لا يزال النص مشوّهًا. ارفع دقة المسح، زِد التباين، أو قسّم الملف إلى أجزاء أقصر قبل إعادة المحاولة.
- تتوقف المعالجة في الأرشيفات الضخمة. قسّم العمل باستخدام تقسيم PDF ثم أعد الدمج عبر دمج PDF.
- تحتاج إلى إخراج نص فقط. بعد التصدير، افتح تنظيم PDF لاستخراج الصفحات المهمة أو انسخ النص مباشرة مع الاحتفاظ بالملف القابل للبحث كمرجع.
- التعامل مع معلومات حساسة. وثّق أن كل شيء يعمل محليًا وادمج هذا المسار مع دليل إخفاء المعلومات الحساسة قبل المشاركة.
قائمة التحقق النهائية قبل المشاركة
- ابحث عن ثلاث عبارات—بما فيها أرقام—للتأكد من عمل طبقة النص.
- كبّر العرض إلى ٢٠٠٪ للتحقق من أن الجداول والأعمدة والتعليقات التوضيحية ما تزال مصطفّة.
- حدّث البيانات الوصفية وأسماء الملفات ليتعرف الفريق على نسخة OCR.
- أرشف النسخ الأصلية والمحوّلة في موقع النسخ الاحتياطي لديك.
- اذكر في ملاحظات التسليم أن الملف قابل للبحث وجاهز لإمكانية الوصول.
استكشف المزيد من مسارات العمل الفعّالة للـ PDF
- خفّف المسوحات الكبيرة عبر دليل ضغط PDF تحت ١ ميغابايت أو أداة ضغط PDF المباشرة.
- ادمج الأقسام بعد المعالجة باستخدام دمج PDF واحتفظ بالإنتاجية عبر دليل أتمتة مهام PDF.
- هل تحتاج إلى تعليقات أو توقيعات بعد OCR؟ اتبع دليل توقيع ملفات PDF أو عالج التخطيط باستخدام دليل تنظيم وتدوير الصفحات.
الأسئلة الشائعة
هل أداة OCR من pdfjuggler مجانية فعلًا؟
نعم. يمكنك تشغيل عدد غير محدود من تحويلات OCR دون حسابات أو علامات مائية أو حدود رفع لأن كل شيء يبقى داخل متصفحك.
ما اللغات وأنظمة الكتابة المدعومة؟
تتضمن الأداة حزم Tesseract التي تغطي عشرات اللغات. اختر اللغة الأساسية—وأي حزم إضافية—في الخطوة ٤ لزيادة الدقة.
هل يمكنني العمل دون اتصال بالإنترنت؟
بالتأكيد. افتح أداة OCR PDF مرة أثناء الاتصال ليتم تخزينها مؤقتًا. بعد ذلك يمكنك إعادة فتح التبويب وإكمال كل خطوة دون اتصال.
كيف أحافظ على أحجام الملفات بعد OCR؟
فعّل خيار الضغط قبل بدء OCR أو أرسل الملف المصدّر عبر ضغط PDF. كلا الخيارين يحافظان على طبقة النص القابلة للبحث.
ماذا عن الكتابة اليدوية أو التواقيع؟
النص المطبوع يتحول بأفضل صورة. تبقى الملاحظات المكتوبة يدويًا كصور، لذا فكّر في كتابة ملخّصات على صفحة منفصلة أو إرفاق المسح الأصلي مع ملف PDF القابل للبحث للسياق.