v25.7

تحسين قابلية استخدام مستخرج النصوص

  • Class TextExtractor: ثابت ولا يتطلب استخدام منشئ.
  • Class TextExtractor: سلوك محسّن عند التشغيل في وضع التقييم. لا استثناء مع مستندات تزيد عن 4 صفحات.
  • Class TextExtractor: تم إصلاح مشكلات في طريقة Process.
  • Class PdfExtractorOptions: تمت إزالته.
  • Class TextExtractorOptions: تم إعادة هيكلة.
  • Enum TextFormattingMode: تمت إعادة تسميته وتحسينه.

مثال على الاستخدام:

// المثال يوضح كيفية استخراج محتوى النص من مستند PDF.
// إنشاء كائن TextExtractorOptions لتحديد التعليمات
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تنفيذ العملية
var results = TextExtractor.Process(options);
// الحصول على النص المستخرج من كائن ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

تحسين قابلية استخدام محوّل HTML

  • Class HtmlConverter: ثابت ولا يتطلب استخدام منشئ.
  • Class HtmlConverter: تم إصلاح مشكلات في طريقة Process.
  • Class HtmlConverter: تمت إزالة منطق IDisposable.
  • Class PdfConverterOptions: تمت إزالته.

أمثلة على الاستخدام:

// المثال يوضح كيفية تحويل PDF إلى مستند HTML.
// إنشاء كائن PdfToHtmlOptions لتحديد نوع بيانات الإخراج كملف مع موارد مضمنة
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_input.pdf"));
// تحديد مسار ملف الإخراج
options.AddOutput(new FileDataSource("path_to_output.html"));
// تنفيذ العملية
HtmlConverter.Process(options);

// المثال يوضح كيفية تحويل HTML إلى مستند PDF.
// إنشاء HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_input.html"));
// تحديد مسار ملف الإخراج
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// تنفيذ العملية
HtmlConverter.Process(options);

تحسين قابلية استخدام مستخرج الصور

  • Class ImageExtractor: ثابت ولا يتطلب استخدام منشئ.

مثال على الاستخدام:

// المثال يوضح كيفية استخراج الصور من مستند PDF.
// إنشاء ImageExtractorOptions لتحديد التعليمات
var options = new ImageExtractorOptions();
// إضافة مسار ملف الإدخال
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// تحديد مسار الدليل للإخراج
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// تنفيذ العملية
var results = ImageExtractor.Process(options);
// الحصول على مسار نتيجة الصورة
var imageExtracted = results.ResultCollection[0].ToFile();

إصلاحات طفيفة

  • إصلاحات داخلية.
  • إصلاح الأمثلة والتلميحات لمحّول TIFF.
  • تقليل مدة تحسين الصفحة.
  • إصلاح: صورة الإخراج غير صحيحة من تحويل PDF إلى PNG.
  • إصلاح: عدم عرض الأحرف الصينية بشكل صحيح أثناء تحويل PDF إلى PNG.
  • تحسين: الأداء أثناء تحويل PDF إلى HTML.
 عربي