v25.7

Cải thiện khả năng sử dụng của Text Extractor

  • Class TextExtractor: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.
  • Class TextExtractor: Cải thiện hành vi khi chạy ở chế độ đánh giá. Không gặp ngoại lệ với tài liệu 4 trang trở lên.
  • Class TextExtractor: đã sửa các vấn đề trong phương thức Process.
  • Class PdfExtractorOptions: đã bị xóa.
  • Class TextExtractorOptions: đã được tái cấu trúc.
  • Enum TextFormattingMode: đã được đổi tên và cải tiến.

Ví dụ Sử Dụng:

// Ví dụ này minh họa cách để trích xuất nội dung văn bản của tài liệu PDF.
// Tạo đối tượng TextExtractorOptions để đặt hướng dẫn
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thực hiện quá trình
var results = TextExtractor.Process(options);
// Lấy văn bản được trích xuất từ đối tượng ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Cải thiện khả năng sử dụng của Html Converter

  • Class HtmlConverter: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.
  • Class HtmlConverter: đã sửa các vấn đề trong phương thức Process.
  • Class HtmlConverter: đã xóa logic IDisposable.
  • Class PdfConverterOptions: đã bị xóa.

Ví dụ Sử Dụng:

// Ví dụ này minh họa cách để chuyển đổi PDF thành tài liệu HTML.
// Tạo đối tượng PdfToHtmlOptions để đặt loại dữ liệu đầu ra là tệp với các tài nguyên nhúng
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Đặt đường dẫn tệp đầu ra
options.AddOutput(new FileDataSource("path_to_output.html"));
// Thực hiện quá trình
HtmlConverter.Process(options);

// Ví dụ này minh họa cách để chuyển đổi HTML sang tài liệu PDF.
// Tạo HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_input.html"));
// Đặt đường dẫn tệp đầu ra
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Thực hiện quá trình
HtmlConverter.Process(options);

Cải thiện khả năng sử dụng của Image Extractor

  • Class ImageExtractor: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.

Ví dụ Sử Dụng:

// Ví dụ này minh họa cách để trích xuất hình ảnh từ tài liệu PDF.
// Tạo ImageExtractorOptions để đặt hướng dẫn
var options = new ImageExtractorOptions();
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Đặt đường dẫn Thư mục đầu ra
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Thực hiện quá trình
var results = ImageExtractor.Process(options);
// Lấy đường dẫn đến hình ảnh kết quả
var imageExtracted = results.ResultCollection[0].ToFile();

Các Sửa Chữa Nhỏ

  • Sửa chữa nội bộ.
  • Đã sửa các ví dụ và gợi ý của Tiff Converter.
  • Giảm thiểu thời gian tối ưu hóa trang.
  • Đã sửa: hình ảnh đầu ra không chính xác trong chuyển đổi PDF sang PNG.
  • Đã sửa: ký tự Trung Quốc không hiển thị đúng trong quá trình chuyển đổi PDF sang PNG.
  • Cải thiện: Hiệu suất trong quá trình chuyển đổi PDF sang HTML.
 Tiếng Việt