v25.10

Plugin mới PDF Extractor

  • Class PdfExtractor: chứa tất cả các chức năng của plugin: TextExtractor, ImageExtractor, FormExporter.
  • Class TextExtractor: sẽ bị xóa sớm, hãy sử dụng PdfExtractor.
  • Class ImageExtractor: sẽ bị xóa sớm, hãy sử dụng PdfExtractor.
  • Class FormExporter: sẽ bị xóa sớm, hãy sử dụng PdfExtractor.
  • Class TextExtractorOptions: được đổi tên thành Class ExtractTextOptions.
  • Class ImageExtractorOptions: được đổi tên thành Class ExtractImagesOptions.
  • Class FormExportToDsvOptions: được đổi tên thành Class ExtractFormDataToDsvOptions.
  • Xem Kiến trúc Plugin Mới.

Ví dụ Sử Dụng:

Ví dụ này trình bày cách trích xuất nội dung văn bản của tài liệu PDF.

// Tạo đối tượng ExtractTextOptions để thiết lập hướng dẫn
var options = new ExtractTextOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thực hiện quy trình
var results = PdfExtractor.ExtractText(options);
// Lấy văn bản đã trích xuất từ đối tượng ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Ví dụ Sử Dụng:

Ví dụ này trình bày cách trích xuất nội dung văn bản của tài liệu PDF với TextFormattingMode.

// Tạo đối tượng ExtractTextOptions để thiết lập TextFormattingMode
var options = new ExtractTextOptions(TextFormattingMode.Pure);
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thực hiện quy trình
var results = PdfExtractor.ExtractText(options);
// Lấy văn bản đã trích xuất từ đối tượng ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Ví dụ Sử Dụng:

Ví dụ này trình bày cách trích xuất hình ảnh từ tài liệu PDF.

// Tạo ExtractImagesOptions để thiết lập hướng dẫn
var options = new ExtractImagesOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn thư mục đầu ra
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Thực hiện quy trình
var results = PdfExtractor.ExtractImages(options);
// Lấy đường dẫn tới hình ảnh kết quả
var imageExtracted = results.ResultCollection[0].ToFile();

Ví dụ Sử Dụng:

Ví dụ này trình bày cách xuất giá trị Form vào file CSV.

// Tạo đối tượng ExtractFormDataToDsvOptions để thiết lập hướng dẫn
var options = new ExtractFormDataToDsvOptions(',', true);
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Thực hiện quy trình
PdfExtractor.ExtractFormData(options);

Plugin mới PDF Manager

  • Class PdfManager: chứa tất cả các chức năng của plugin: Merger, Optimizer, Splitter, TableGenerator, TocGenerator.
  • Class Merger: sẽ bị xóa sớm.
  • Class Optimizer: sẽ bị xóa sớm, hãy sử dụng PdfManager.
  • Class Splitter: sẽ bị xóa sớm, hãy sử dụng PdfManager.
  • Class TableGenerator: sẽ bị xóa sớm, hãy sử dụng PdfManager.
  • Class TocGenerator: sẽ bị xóa sớm, hãy sử dụng PdfManager.
  • Xem Kiến trúc Plugin Mới.

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Gộp hai tài liệu PDF.

// Tạo đối tượng MergeOptions để thiết lập hướng dẫn
var options = new MergeOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.Merge(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Chia tài liệu PDF.

// Tạo đối tượng SplitOptions để thiết lập hướng dẫn
var options = new SplitOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
// Thực hiện quy trình
PdfManager.Split(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Tối ưu tài liệu PDF.

// Tạo đối tượng OptimizeOptions để thiết lập hướng dẫn
var options = new OptimizeOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.Optimize(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Xoay tài liệu PDF.

// Tạo đối tượng RotateOptions để thiết lập hướng dẫn
var options = new RotateOptions();
// Thiết lập Xoay mới
options.Rotation = Rotation.On90;
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.Rotate(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Thay đổi kích thước tài liệu PDF.

// Tạo đối tượng ResizeOptions để thiết lập hướng dẫn
var options = new ResizeOptions();
// Thiết lập Kích thước Trang mới
options.PageSize = PageSize.A3;
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.Resize(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Nén tài liệu PDF.

// Tạo đối tượng CompressOptions để thiết lập hướng dẫn
var options = new CompressOptions();
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.Compress(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách Thêm Bảng vào file PDF.

// Cấu hình các tùy chọn bảng
var options = new TableOptions();
options.InsertPageBefore(1)
   .AddTable()
        .AddRow()
            .AddCell().AddParagraph("Tên")
            .AddCell().AddParagraph("Tuổi")
        .AddRow()
            .AddCell().AddParagraph("Bob")
            .AddCell().AddParagraph("12")
        .AddRow()
            .AddCell().AddParagraph("Sam")
            .AddCell().AddParagraph("20")
        .AddRow()
            .AddCell().AddParagraph("Sandy")
            .AddCell().AddParagraph("26")
        .AddRow()
            .AddCell().AddParagraph("Tom")
            .AddCell().AddParagraph("12")
        .AddRow()
            .AddCell().AddParagraph("Jim")
            .AddCell().AddParagraph("27");
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Thực hiện quy trình
PdfManager.AddTable(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách thêm Mục lục vào file PDF.

// Tạo đối tượng TocOptions để thiết lập hướng dẫn
var options = new TocOptions();
// Thiết lập Tiêu đề
options.Title = "Mục lục của tôi";
// Thiết kế Đầu đề
options.Headings.Add(new TocHeading("Giới thiệu", 2));
options.Headings.Add(new TocHeading("Chương I", 3));
options.Headings.Add(new TocHeading("Chương II", 4));
options.Headings.Add(new TocHeading("Chương III", 5));
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.AddTableOfContents(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách thêm Mục lục vào file PDF với việc tạo dấu trang.

// Tạo đối tượng TocOptions để thiết lập hướng dẫn
var options = new TocOptions();
// Thiết lập Tiêu đề
options.Title = "Mục lục của tôi";
// Tạo liên kết trong dấu trang
options.GenerateBookmarks = true;
// Thiết kế Đầu đề
options.Headings.Add(new TocHeading("Giới thiệu", 2, false, 1));
options.Headings.Add(new TocHeading("Chương I", 3, true, 1));
options.Headings.Add(new TocHeading("Chương II", 4, true, 1));
options.Headings.Add(new TocHeading("Ví dụ A", 4, true, 2));
options.Headings.Add(new TocHeading("Ví dụ B", 4, true, 2));
options.Headings.Add(new TocHeading("Ví dụ C", 4, true, 2));
options.Headings.Add(new TocHeading("Ví dụ D", 4, true, 2));
options.Headings.Add(new TocHeading("Chương III", 5, true, 1));
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập đường dẫn file đầu ra
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Thực hiện quy trình
PdfManager.AddTableOfContents(options);

Ví dụ Sử Dụng:

Ví dụ này trình bày cách thêm Mục lục vào file PDF và lưu dưới dạng stream.

// Tạo đối tượng TocOptions để thiết lập hướng dẫn
var options = new TocOptions();
// Thiết lập Tiêu đề
options.Title = "Mục lục của tôi";
// Thiết kế Đầu đề
options.Headings.Add(new TocHeading("Giới thiệu", 2, false, 1));
// Thêm đường dẫn file đầu vào
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Thiết lập stream đầu ra 
var outputStream = new MemoryStream();
options.AddOutput(new StreamDataSource(outputStream));
options.CloseOutputStreams = false;
// Thực hiện quy trình
PdfManager.AddTableOfContents(options);

Nâng cao tính khả dụng của TableGenerator

  • Class TableGenerator: là tĩnh và không yêu cầu sử dụng constructor.
  • Class TableGenerator: được đánh dấu là Obsolete. Hãy sử dụng PdfManager thay thế.

Nâng cao tính khả dụng của PdfChatGpt

  • Class PdfChatGpt: là tĩnh và không yêu cầu sử dụng constructor.
  • Class PdfChatGptRequestOptions: thêm thuộc tính CancellationToken (Chuyển từ PdfChatGpt).

Ví dụ Sử Dụng:

Ví dụ này trình bày cách sử dụng plugin PdfChatGpt bằng cách thêm tin nhắn vào yêu cầu.

var options = new PdfChatGptRequestOptions();
options.AddOutput(new FileDataSource("PdfChatGPT_output.pdf")); // Thêm đường dẫn file đầu ra.
options.ApiKey = "Your API key."; // Bạn cần cung cấp khóa để truy cập API.
options.MaxTokens = 1000; // Số lượng tối đa token được tạo trong phần trả lời chat.
// để hủy
// var cancelTokenSource = new CancellationTokenSource();
// var cToken = cancelTokenSource.Token;
// options.CancellationToken = cToken;

// Thêm các tin nhắn yêu cầu.
options.Messages.Add(new Message
{
    Content = "Bạn là một trợ lý hữu ích.",
    Role = Role.System
});
options.Messages.Add(new Message
{
    Content = "Đường kính pizza lớn nhất từng được làm là bao nhiêu?",
    Role = Role.User
});

// Xử lý yêu cầu.
await PdfChatGpt.ProcessAsync(options);

Sửa lỗi

  • Đã fix lỗi chuyển đổi html sang pdf metadata
  • Đã fix lỗi định dạng văn bản PDF sang PDF/A_3b và hình ảnh bị phóng to
  • Đã fix lỗi PDF sang PDFA: báo cáo PDFA kết quả bị lỗi khi in
  • Đã fix lỗi PDF sang HTML: hình ảnh kết quả chứa nền
  • Đã fix lỗi HTML sang PDF: Một số ký tự Trung Quốc xuất hiện dưới dạng hộp
  • Đã fix lỗi HTML sang PDF: font tùy chỉnh base64 không được tôn trọng
  • Đã fix lỗi HTML sang PDF: css trường biểu mẫu không được áp dụng
  • Đã fix lỗi HTML sang PDF: biểu đồ không được hiển thị đúng cách
  • Đã fix lỗi HTML sang PDF: Ký tự đặc biệt không được hiển thị
 Tiếng Việt