v25.12

新しいプラグイン PDF Form

  • Class PdfForm: プラグインのすべての機能 (FormFlattener、FormExporter) を含みます。また、フィールドの削除と取得が可能です。
  • Class FormFlattener: まもなく削除されます。PdfForm を使用してください。
  • Class FormFlattenerOptions: Class FlattenFieldsOptions に名前が変更されました。
  • Class GetFieldNamesOptions: フィールド名取得のオプションを設定できます。
  • Class RemoveFieldsOptions: フィールド削除のオプションを設定できます。
  • The New Plugin Architecture を参照してください。

使用例:

PDF ファイルのフィールドをフラット化する例です。

// Create FlattenFieldsOptions object to set instructions
var options = new FlattenFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Flatten(options);

使用例:

PDF ファイルからフィールド名を取得する例です。

var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));

使用例:

フォームの値を CSV ファイルにエクスポートする例です。

// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfForm.Extract(options);

使用例:

PDF ファイルからフィールドを削除する例です。

// Create RemoveFieldsOptions object to set instructions
var options = new RemoveFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Remove(options);

PDF Extractor の変更点

  • Method ExtractText: Method Extract に名前が変更されました。
  • Method ExtractImages: Method Extract に名前が変更されました。
  • Method ExtractFormData: Method Extract に名前が変更されました。

使用例:

PDF ドキュメントからテキストコンテンツを抽出する例です。

// Create ExtractTextOptions object to set instructions
var options = new ExtractTextOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get the extracted text from the ResultContainer object
var textExtracted = results.ResultCollection[0].ToString();

使用例:

PDF ドキュメントから画像を抽出する例です。

// Create ExtractImagesOptions to set instructions
var options = new ExtractImagesOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output Directory path
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get path to image result
var imageExtracted = results.ResultCollection[0].ToFile();

使用例:

フォームの値を CSV ファイルにエクスポートする例です。

// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfExtractor.Extract(options);

強化ポイント

  • Class PdfConverterOptions、PdfToXlsOptions は Class PluginBaseOptions を使用してください。
  • PDF/A-1b 変換
  • PDF/A-2b 変換

修正済みバグ

  • HTML から PDF への変換でのフォーマット問題を修正
  • PDF から HTML への変換で一部リンクが失われる問題を修正
 日本語