最新动态

v25.7

  • 改进了文本提取器的可用性
  • 改进了Html转换器的可用性
  • 改进了图像提取器的可用性

v25.6

  • 改进了 Tiff 转换器的可用性

v25.5

  • 新增插件: 表单导出器
  • 改进了安全性可用性

v25.4

  • 优化器可用性的改进
  • 插件拆分器可用性的改进
  • 插件合并器可用性的改进

v25.3

  • 添加新插件:表单扁平化工具

v25.2

  • 新增插件:目录生成器

v25.1

  • 改进的插件:ImageExtractor

v24.12

  • 新增插件:PDF 转 PNG 转换器
  • 新增插件:PDF 转 TIFF 转换器
  • 新增插件:PDF 表格生成器
  • 将类 PdfDoc 重命名为 DocConverter

v24.11

  • 添加新插件:PDF到JPEG转换器
  • 添加类 DirectoryDataSource
  • 添加类 PdfToJpegOptions

v24.10

  • 新增插件:PDF/A 转换器

v24.9

  • 发布
2024年12月28日

最新动态 的子部分

v25.7

改进了文本提取器的可用性

  • Class TextExtractor: 是静态的,不需要使用构造函数。
  • Class TextExtractor: 在评估模式下运行时改善了行为。处理4页以上的文档时没有异常。
  • Class TextExtractor: 修复了方法 Process 中的问题。
  • Class PdfExtractorOptions: 已移除。
  • Class TextExtractorOptions: 已重构。
  • Enum TextFormattingMode: 已重命名并改进。

使用示例:

// 该示例演示如何提取PDF文档的文本内容。
// 创建 TextExtractorOptions 对象以设置指令
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 执行处理
var results = TextExtractor.Process(options);
// 从 ResultContainer 对象中获取提取的文本
var textExtracted = results.ResultCollection[0].ToString();

改进了Html转换器的可用性

  • Class HtmlConverter: 是静态的,不需要使用构造函数。
  • Class HtmlConverter: 修复了方法 Process 中的问题。
  • Class HtmlConverter: 移除了IDisposable逻辑。
  • Class PdfConverterOptions: 已移除。

使用示例:

// 该示例演示如何将PDF转换为HTML文档。
// 创建 PdfToHtmlOptions 对象以设置输出数据类型为带嵌入资源的文件
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_input.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_output.html"));
// 执行处理
HtmlConverter.Process(options);

// 该示例演示如何将HTML转换为PDF文档。
// 创建 HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_input.html"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// 执行处理
HtmlConverter.Process(options);

改进了图像提取器的可用性

  • Class ImageExtractor: 是静态的,不需要使用构造函数。

使用示例:

// 该示例演示如何从PDF文档中提取图像。
// 创建 ImageExtractorOptions 以设置指令
var options = new ImageExtractorOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出目录路径
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 执行处理
var results = ImageExtractor.Process(options);
// 获取图像结果的路径
var imageExtracted = results.ResultCollection[0].ToFile();

小修复

  • 内部修复。
  • 修复了Tiff转换器的示例和提示。
  • 减少了页面优化的持续时间。
  • 修复了:PDF到PNG转换中,输出图像不正确。
  • 修复了:PDF到PNG转换中,中文字符显示不正确。
  • 改进了:PDF到HTML转换期间的性能。
2025年7月10日

v25.6

改进了 Tiff 转换器的可用性

  • Class PdfToTiffOptions: 添加了额外的转换参数 - 压缩。
  • Class PdfToTiffOptions: 添加了额外的转换参数 - 色深。
  • Class TiffConverter 是静态的,不需要使用构造函数。
  • 改进了主要示例。

示例用法:

// 该示例演示如何将 PDF 文档转换为 TIFF 格式。
// 创建 PdfToTiffOptions 对象以设置指令
var options = new PdfToTiffOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出目录路径
options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
// 执行该过程
TiffConverter.Process(options);

// 该示例演示如何将 PDF 文档转换为 TIFF 格式并使用附加参数。
// 创建 PdfToTiffOptions 对象以设置指令
var options = new PdfToTiffOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出目录路径
options.AddOutput(new DirectoryDataSource("path_to_output_directory"));
// 可选参数
options.PageList = new List<int> { 1, 3 };
options.MultiPage = true;
options.OutputResolution = 400;
options.Compression = TiffCompression.RLE;
options.ColorDepth = TiffColorDepth.Format24bpp;
// 执行该过程
TiffConverter.Process(options);

小修复

  • 内部修复。
2025年7月10日

v25.5

新增插件: 表单导出器

  • Class FormExporter: 代表 Documentize.FormExporter 插件,用于将 PDF 文档的表单值导出到 DSV 或 CSV 文件中
  • Class FormExportToDsvOptions: 代表使用 Documentize.FormExporter 插件将 PDF 文档的值导出到 DSV 或 CSV 文件的选项。

示例用法:

// 该示例演示如何将表单值导出到 CSV 文件。
// 创建 FormExportToDsvOptions 对象以设置指令
var options = new FormExportToDsvOptions(',', true);
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// 执行处理
FormExporter.Process(options);

改进了安全性可用性

  • 该类是静态的,不需要使用构造函数。
  • 改进了主要示例。

示例用法:

// 该示例演示如何加密 PDF 文档。
// 创建 EncryptionOptions 对象以设置指令
var options = new EncryptionOptions("123456", "qwerty");
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Security.Process(options);

// 该示例演示如何解密 PDF 文档。
// 创建 DecryptionOptions 对象以设置指令
var options = new DecryptionOptions("123456");
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Security.Process(options);

小修复

  • 改进了类提示和许可证。
2025年7月10日

v25.4

优化器可用性的改进

  • 该类是静态的,不需要使用构造函数。
  • 改进了主要示例。
  • 添加了额外的示例。

示例用法:

// 该示例演示如何优化PDF文档。
// 创建OptimizeOptions对象来设置指令
var options = new OptimizeOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Optimizer.Process(options);

// 该示例演示如何旋转PDF文档。
// 创建RotateOptions对象来设置指令
var options = new RotateOptions();
// 设置新的旋转
options.Rotation = Rotation.On90;
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Optimizer.Process(options);

// 该示例演示如何调整PDF文档的大小。
// 创建ResizeOptions对象来设置指令
var options = new ResizeOptions();
// 设置新的页面大小
options.PageSize = PageSize.A3;
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Optimizer.Process(options);

// 该示例演示如何压缩PDF文档。
// 创建CompressOptions对象来设置指令
var options = new CompressOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Optimizer.Process(options);

插件拆分器可用性的改进

  • 该类是静态的,不需要使用构造函数。
  • 改进了主要示例。

示例用法:

// 该示例演示如何拆分PDF文档。
// 创建SplitOptions对象来设置指令
var options = new SplitOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file_1.pdf"));
options.AddOutput(new FileDataSource("path_to_result_pdf_file_2.pdf"));
// 执行处理
Splitter.Process(options);

插件合并器可用性的改进

  • 该类是静态的,不需要使用构造函数。
  • 改进了主要示例。

示例用法:

// 该示例演示如何合并两个PDF文档。
// 创建MergeOptions对象来设置指令
var options = new MergeOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file_1.pdf"));
options.AddInput(new FileDataSource("path_to_your_pdf_file_2.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
Merger.Process(options);

小修复

  • 改进了类提示。
2025年7月10日

v25.3

添加新插件:表单扁平化工具

  • Class FormFlattener:表示 Documentize.FormFlattener 插件,用于扁平化 PDF 文档中的字段。
  • Class FormFlattenerOptions:表示通过 Documentize.FormFlattener 插件在文档中扁平化字段的选项。

示例用法:

//该示例演示如何扁平化 PDF 文件中的字段。
// 创建 FormFlattenerOptions 对象以设置指令
var options = new FormFlattenerOptions();
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
//可选参数,跳过名称为“Surname”的字段。
options.SkipFields.Add("Surname");
// 执行该过程
FormFlattener.Process(options);

//该示例演示如何从 PDF 文件中获取字段名称。
var fieldNames = FormFlattener.GetFieldNames("path_to_your_pdf_file.pdf");

小修复

  • 改进了类提示和示例。
2025年7月10日

v25.2

新增插件:目录生成器

  • Class TocGenerator: 表示 Documentize.TocGenerator 插件。用于向 PDF 文档添加目录。
  • Class TocOptions: 表示通过 Documentize.TocGenerator 插件向文档添加目录的选项。
  • Class TocHeading: 表示通过 Documentize.TocGenerator 插件向文档添加目录的标题或章节选项。

示例用法:

// 该示例演示如何向 PDF 文件添加目录。
var options = new TocOptions();
// 设置标题
options.Title = "我的目录";
// 在书签中生成链接
options.GenerateBookmarks = true;
// 设计标题
options.Headings.Add(new TocHeading("引言", 2, false, 1));
options.Headings.Add(new TocHeading("第一章", 3, true, 1));
options.Headings.Add(new TocHeading("第二章", 4, true, 1));
options.Headings.Add(new TocHeading("示例 A", 4, true, 2));
options.Headings.Add(new TocHeading("示例 B", 4, true, 2));
options.Headings.Add(new TocHeading("示例 C", 4, true, 2));
options.Headings.Add(new TocHeading("示例 D", 4, true, 2));
options.Headings.Add(new TocHeading("第三章", 5, true, 1));
// 添加输入文件路径
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// 执行处理
TocGenerator.Process(options);

小修复

  • 改进了类提示和示例。
  • 更新了水印。
  • 改进了 PDF 转换为 XSLX。
  • 改进了 PDF 转换为 PDF/A-1a。
2025年7月10日

v25.1

改进的插件:ImageExtractor

  • 添加了输出集合到 ImageExtractorOptions。
  • 添加了对 ImageExtractorOptions 的多个输入的支持。
  • 修复了关闭的输出流。

示例用法:

// 创建 ImageExtractor 对象以提取图像
var plugin = new ImageExtractor();
// 创建 ImageExtractorOptions
var opt = new ImageExtractorOptions();
// 添加输入文件路径
opt.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出目录
opt.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 执行提取过程
var resultContainer = plugin.Process(opt);
// 从 ResultContainer 对象中获取图像
var imageExtracted = resultContainer.ResultCollection[0].ToFile();

小修复

  • 改进类提示和示例。
  • PDF 签名验证。
  • 改进了对中文字符的支持。
2025年7月10日

v24.12

新增插件:PDF 转 PNG 转换器

  • 类 PngConverter:表示 Documentize.PngConverter 插件。用于将 PDF 文档转换为 PNG 格式。
  • 类 PdfToPngOptions:表示 Documentize.PngConverter 插件的 PDF 到 PNG 转换选项。

示例用法:

// 创建 PngConverter
var plugin = new PngConverter();
// 创建 PdfToPngOptions 对象以设置指令
var opt = new PdfToPngOptions();
// 添加输入文件路径
opt.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
opt.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 执行处理
plugin.Process(opt);

新增插件:PDF 转 TIFF 转换器

  • 类 TiffConverter:表示 Documentize.TiffConverter 插件。用于将 PDF 文档转换为 TIFF 格式。
  • 类 PdfToTiffOptions:表示 Documentize.TiffConverter 插件的 PDF 到 TIFF 转换选项。

示例用法:

// 创建 TiffConverter
var plugin = new TiffConverter();
// 创建 PdfToTiffOptions 对象以设置指令
var opt = new PdfToTiffOptions();
// 添加输入文件路径
opt.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
opt.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 执行处理
plugin.Process(opt);

新增插件:PDF 表格生成器

  • 类 TableGenerator:表示 Documentize.TableGenerator 插件。用于向 PDF 文档添加表格。
  • 类 TableBuilder:表示 PDF 页面中表格的构建器的类。
  • 类 TableRowBuilder:表示表格行的构建器的类。
  • 类 TableCellBuilder:表示表格单元格的构建器的类。

示例用法:

// 创建 TableGenerator
var plugin = new TableGenerator();
// 创建 TableOptions 对象以设置指令
TableOptions opt = new TableOptions().InsertPageBefore(1)
   .AddTable()
        .AddRow()
            .AddCell().AddParagraph("名称")
            .AddCell().AddParagraph("年龄")
        .AddRow()
            .AddCell().AddParagraph("Bob")
            .AddCell().AddParagraph("12")
        .AddRow()
            .AddCell().AddParagraph("Sam")
            .AddCell().AddParagraph("20")
        .AddRow()
            .AddCell().AddParagraph("Sandy")
            .AddCell().AddParagraph("26")
        .AddRow()
            .AddCell().AddParagraph("Tom")
            .AddCell().AddParagraph("12")
        .AddRow()
            .AddCell().AddParagraph("Jim")
            .AddCell().AddParagraph("27");
// 添加输入文件路径
opt.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 设置输出文件路径
opt.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));
// 执行处理
plugin.Process(opt);

将类 PdfDoc 重命名为 DocConverter

  • 类 DocConverter:表示 Documentize.DocConverter 插件。用于将 PDF 文档转换为 DOC/DOCX 格式。

示例用法:

// 创建 DocConverter
var plugin = new DocConverter();
// 创建 PdfToDocOptions 对象以设置指令
var opt = new PdfToDocOptions();
// 添加输入文件路径
opt.AddInput(new FileDataSource(inputPath));
// 设置输出文件路径
opt.AddOutput(new FileDataSource(outputPath));
// 执行处理
plugin.Process(opt);
2025年7月10日

v24.11

添加新插件:PDF到JPEG转换器

  • 目的JpegConverter 类旨在将 PDF 文档转换为 JPEG 格式,使用户更容易处理和共享来自 PDF 的图像。
  • 构造函数
    • JpegConverter():初始化 JPEG 转换器的新实例。

示例用法:

var plugin = new JpegConverter();
var opt = new PdfToJpegOptions();
opt.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
opt.AddOutput(new DirectoryDataSource("path_to_results_directory"));
plugin.Process(opt);
  • 方法
    • Process(PdfToJpegOptions options):使用指定的选项启动 JPEG 转换过程。

添加类 DirectoryDataSource

  • 目的DirectoryDataSource 类允许用户管理用于插件中加载和保存操作的目录数据。
  • 构造函数
    • DirectoryDataSource(string path):使用指定路径初始化新的目录数据对象。

示例用法:

var directorySource = new DirectoryDataSource("path_to_your_directory");
  • 属性
    • DataType:检索数据源的类型。
    • Path:获取当前数据目录的路径。

添加类 PdfToJpegOptions

  • 目的:此类包含用于配置 JPEG 转换过程的选项,允许用户指定分辨率、页面列表和图像质量。
  • 构造函数
    • PdfToJpegOptions():为 JPEG 转换器初始化新的选项实例。

属性:

  • OutputResolution:指定生成的 JPEG 图像的分辨率。
  • PageList:要从 PDF 转换的页面列表。
  • Quality:设置 JPEG 输出的质量。
2025年7月10日

v24.10

新增插件:PDF/A 转换器

  • 引入了一项新的 PDF/A 转换功能,允许用户轻松将标准 PDF 文件转换为符合 PDF/A 的文档。

使用示例:

var options = new PdfAConvertOptions
{
    PdfAVersion = PdfAStandardVersion.PDF_A_3B
};

options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));

var plugin = new PdfAConverter();
plugin.Process(options);

修复的漏洞

  • 修复了与 FileResult 类相关的问题,导致输出路径不正确。
  • 解决了在处理大文件时影响 HtmlConverter 的小错误。

改进

  • 增强了 PdfExtractorImageExtractor 的性能,以实现更快的处理时间。
  • 更新了 RotateOptions 类以支持额外的旋转角度。
2025年7月10日

v24.9

发布

 中文