v25.7
تحسين قابلية استخدام مستخرج النصوص
- Class TextExtractor: ثابت ولا يتطلب استخدام منشئ.
- Class TextExtractor: سلوك محسّن عند التشغيل في وضع التقييم. لا استثناء مع مستندات تزيد عن 4 صفحات.
- Class TextExtractor: تم إصلاح مشكلات في طريقة Process.
- Class PdfExtractorOptions: تمت إزالته.
- Class TextExtractorOptions: تم إعادة هيكلة.
- Enum TextFormattingMode: تمت إعادة تسميته وتحسينه.
مثال على الاستخدام:
// المثال يوضح كيفية استخراج محتوى النص من مستند PDF.
// إنشاء كائن TextExtractorOptions لتحديد التعليمات
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تنفيذ العملية
var results = TextExtractor.Process(options);
// الحصول على النص المستخرج من كائن ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
تحسين قابلية استخدام محوّل HTML
- Class HtmlConverter: ثابت ولا يتطلب استخدام منشئ.
- Class HtmlConverter: تم إصلاح مشكلات في طريقة Process.
- Class HtmlConverter: تمت إزالة منطق IDisposable.
- Class PdfConverterOptions: تمت إزالته.
أمثلة على الاستخدام:
// المثال يوضح كيفية تحويل PDF إلى مستند HTML.
// إنشاء كائن PdfToHtmlOptions لتحديد نوع بيانات الإخراج كملف مع موارد مضمنة
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_input.pdf"));
// تحديد مسار ملف الإخراج
options.AddOutput(new FileDataSource("path_to_output.html"));
// تنفيذ العملية
HtmlConverter.Process(options);
// المثال يوضح كيفية تحويل HTML إلى مستند PDF.
// إنشاء HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_input.html"));
// تحديد مسار ملف الإخراج
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// تنفيذ العملية
HtmlConverter.Process(options);
تحسين قابلية استخدام مستخرج الصور
- Class ImageExtractor: ثابت ولا يتطلب استخدام منشئ.
مثال على الاستخدام:
// المثال يوضح كيفية استخراج الصور من مستند PDF.
// إنشاء ImageExtractorOptions لتحديد التعليمات
var options = new ImageExtractorOptions();
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تحديد مسار الدليل للإخراج
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// تنفيذ العملية
var results = ImageExtractor.Process(options);
// الحصول على مسار نتيجة الصورة
var imageExtracted = results.ResultCollection[0].ToFile();
إصلاحات طفيفة
- إصلاحات داخلية.
- إصلاح الأمثلة والتلميحات لمحّول TIFF.
- تقليل مدة تحسين الصفحة.
- إصلاح: صورة الإخراج غير صحيحة من تحويل PDF إلى PNG.
- إصلاح: عدم عرض الأحرف الصينية بشكل صحيح أثناء تحويل PDF إلى PNG.
- تحسين: الأداء أثناء تحويل PDF إلى HTML.