v25.7

テキスト抽出ツールの使いやすさ向上

  • Class TextExtractor: は静的で、コンストラクタを使用する必要はありません。
  • Class TextExtractor: 評価モードでの動作が改善されました。4ページ以上のドキュメントで例外が発生しません。
  • Class TextExtractor: メソッド Process における問題が修正されました。
  • Class PdfExtractorOptions: 削除されました。
  • Class TextExtractorOptions: リファクタリングされました。
  • Enum TextFormattingMode: 名前が変更され、改善されました。

使用例:

// この例は、PDF ドキュメントのテキスト内容を抽出する方法を示しています。
// TextExtractorOptions オブジェクトを作成して指示を設定します
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 処理を実行
var results = TextExtractor.Process(options);
// ResultContainer オブジェクトから抽出されたテキストを取得
var textExtracted = results.ResultCollection[0].ToString();

HTML コンバータの使いやすさ向上

  • Class HtmlConverter: は静的で、コンストラクタを使用する必要はありません。
  • Class HtmlConverter: メソッド Process における問題が修正されました。
  • Class HtmlConverter: IDisposable ロジックが削除されました。
  • Class PdfConverterOptions: 削除されました。

使用例:

// この例は、PDF を HTML ドキュメントに変換する方法を示しています。
// PdfToHtmlOptions オブジェクトを作成して出力データタイプを埋め込みリソース付きファイルに設定します
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_input.pdf"));
// 出力ファイルパスを設定
options.AddOutput(new FileDataSource("path_to_output.html"));
// 処理を実行
HtmlConverter.Process(options);

// この例は、HTML を PDF ドキュメントに変換する方法を示しています。
// HtmlToPdfOptions を作成
var options = new HtmlToPdfOptions();
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_input.html"));
// 出力ファイルパスを設定
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// 処理を実行
HtmlConverter.Process(options);

画像抽出ツールの使いやすさ向上

  • Class ImageExtractor: は静的で、コンストラクタを使用する必要はありません。

使用例:

// この例は、PDF ドキュメントから画像を抽出する方法を示しています。
// 指示を設定するために ImageExtractorOptions を作成します
var options = new ImageExtractorOptions();
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 出力ディレクトリパスを設定
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 処理を実行
var results = ImageExtractor.Process(options);
// 画像結果へのパスを取得
var imageExtracted = results.ResultCollection[0].ToFile();

マイナー修正

  • 内部修正。
  • Tiff コンバータの例とヒントが修正されました。
  • ページ最適化の時間が短縮されました。
  • 修正: PDF から PNG への変換時に出力画像が不正確でした。
  • 修正: PDF から PNG への変換時に中国語の文字が正しく表示されませんでした。
  • 改善: PDF から HTML への変換時のパフォーマンス。
 日本語