v25.7
- Class TextExtractor: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.
- Class TextExtractor: Cải thiện hành vi khi chạy ở chế độ đánh giá. Không gặp ngoại lệ với tài liệu 4 trang trở lên.
- Class TextExtractor: đã sửa các vấn đề trong phương thức Process.
- Class PdfExtractorOptions: đã bị xóa.
- Class TextExtractorOptions: đã được tái cấu trúc.
- Enum TextFormattingMode: đã được đổi tên và cải tiến.
Ví dụ Sử Dụng:
// Ví dụ này minh họa cách để trích xuất nội dung văn bản của tài liệu PDF.
// Tạo đối tượng TextExtractorOptions để đặt hướng dẫn
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thực hiện quá trình
var results = TextExtractor.Process(options);
// Lấy văn bản được trích xuất từ đối tượng ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Cải thiện khả năng sử dụng của Html Converter
- Class HtmlConverter: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.
- Class HtmlConverter: đã sửa các vấn đề trong phương thức Process.
- Class HtmlConverter: đã xóa logic IDisposable.
- Class PdfConverterOptions: đã bị xóa.
Ví dụ Sử Dụng:
// Ví dụ này minh họa cách để chuyển đổi PDF thành tài liệu HTML.
// Tạo đối tượng PdfToHtmlOptions để đặt loại dữ liệu đầu ra là tệp với các tài nguyên nhúng
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Đặt đường dẫn tệp đầu ra
options.AddOutput(new FileDataSource("path_to_output.html"));
// Thực hiện quá trình
HtmlConverter.Process(options);
// Ví dụ này minh họa cách để chuyển đổi HTML sang tài liệu PDF.
// Tạo HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_input.html"));
// Đặt đường dẫn tệp đầu ra
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Thực hiện quá trình
HtmlConverter.Process(options);
- Class ImageExtractor: là tĩnh và không yêu cầu sử dụng một hàm khởi tạo.
Ví dụ Sử Dụng:
// Ví dụ này minh họa cách để trích xuất hình ảnh từ tài liệu PDF.
// Tạo ImageExtractorOptions để đặt hướng dẫn
var options = new ImageExtractorOptions();
// Thêm đường dẫn tệp đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Đặt đường dẫn Thư mục đầu ra
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Thực hiện quá trình
var results = ImageExtractor.Process(options);
// Lấy đường dẫn đến hình ảnh kết quả
var imageExtracted = results.ResultCollection[0].ToFile();
Các Sửa Chữa Nhỏ
- Sửa chữa nội bộ.
- Đã sửa các ví dụ và gợi ý của Tiff Converter.
- Giảm thiểu thời gian tối ưu hóa trang.
- Đã sửa: hình ảnh đầu ra không chính xác trong chuyển đổi PDF sang PNG.
- Đã sửa: ký tự Trung Quốc không hiển thị đúng trong quá trình chuyển đổi PDF sang PNG.
- Cải thiện: Hiệu suất trong quá trình chuyển đổi PDF sang HTML.