v26.1

Tính năng mới: Trích xuất Thuộc tính cho PDF Extractor

  • Trích xuất Thuộc tính PDF: Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang.
  • Class Extractor: thêm phương thức Extract để trích xuất Thuộc tính PDF.
  • Class ExtractPropertiesOptions: Đại diện cho các tùy chọn Trích xuất Thuộc tính PDF cho plugin PdfExtractor.
  • Class PdfProperties: Đại diện cho các Thuộc tính và thông tin meta của tài liệu PDF.
  • Interface IHaveInput: Được sử dụng cho các tùy chọn có dữ liệu đầu vào duy nhất.
  • Class OptionsWithInput: Được sử dụng cho các tùy chọn có dữ liệu đầu vào duy nhất.
  • Full Free functional.

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính (Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang) từ file PDF.

// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính (Tiêu đề, Tác giả, Chủ đề, Từ khóa, Số trang) từ luồng PDF.

// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ví dụ sử dụng:

Ví dụ minh họa cách Trích xuất Thuộc tính từ file PDF theo phong cách ngắn gọn nhất.

// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Cải tiến

  • Cải tiến HTML sang PDF hỗ trợ văn bản thay thế cho hình ảnh
  • Tuân thủ PDF sang PDFA1b

Sửa lỗi

  • Lỗi xảy ra khi cố gắng tối ưu hoá file PDF
  • Vấn đề căn chỉnh dọc của trường Form
  • Sửa lỗi hiển thị văn bản tiếng Nhật trong FormField
  • HTML sang PDF – Vấn đề định dạng bảng
  • Tối ưu kích thước PDF trước khi chuyển PDF sang PDF/A gây ra file đầu ra bị hỏng
  • PDF sang DOC – Bảng hiển thị không đúng
  • PDF sang Excel – Vấn đề định dạng file đầu ra
  • PDF sang HTML – ArgumentException xuất hiện trong quá trình chuyển đổi
  • Chuyển đổi PDF sang HTML thiếu một số liên kết
  • Văn bản bị thiếu khi chuyển PDF sang HTML
 Tiếng Việt