v26.1
Tính năng mới: Trích xuất Thuộc tính cho PDF Extractor
- Trích xuất Thuộc tính PDF: Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang.
- Class Extractor: thêm phương thức Extract để trích xuất Thuộc tính PDF.
- Class ExtractPropertiesOptions: Đại diện cho các tùy chọn Trích xuất Thuộc tính PDF cho plugin PdfExtractor.
- Class PdfProperties: Đại diện cho các Thuộc tính và thông tin meta của tài liệu PDF.
- Interface IHaveInput: Được sử dụng cho các tùy chọn có dữ liệu đầu vào duy nhất.
- Class OptionsWithInput: Được sử dụng cho các tùy chọn có dữ liệu đầu vào duy nhất.
- Full Free functional.
Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính (Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang) từ file PDF.
// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính (Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang) từ luồng PDF.
// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ví dụ sử dụng:
Ví dụ minh họa cách Trích xuất Thuộc tính từ file PDF theo phong cách ngắn gọn nhất.
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));Cải tiến
- Cải tiến HTML sang PDF hỗ trợ văn bản thay thế cho hình ảnh
- Tuân thủ PDF sang PDFA1b
Sửa lỗi
- Lỗi xảy ra khi cố gắng tối ưu hoá file PDF
- Vấn đề căn chỉnh dọc của trường Form
- Sửa lỗi hiển thị văn bản tiếng Nhật trong FormField
- HTML sang PDF – Vấn đề định dạng bảng
- Tối ưu kích thước PDF trước khi chuyển PDF sang PDF/A gây ra file đầu ra bị hỏng
- PDF sang DOC – Bảng hiển thị không đúng
- PDF sang Excel – Vấn đề định dạng file đầu ra
- PDF sang HTML – ArgumentException xuất hiện trong quá trình chuyển đổi
- Chuyển đổi PDF sang HTML thiếu một số liên kết
- Văn bản bị thiếu khi chuyển PDF sang HTML