v25.7
テキスト抽出ツールの使いやすさ向上
- Class TextExtractor: は静的で、コンストラクタを使用する必要はありません。
- Class TextExtractor: 評価モードでの動作が改善されました。4ページ以上のドキュメントで例外が発生しません。
- Class TextExtractor: メソッド Process における問題が修正されました。
- Class PdfExtractorOptions: 削除されました。
- Class TextExtractorOptions: リファクタリングされました。
- Enum TextFormattingMode: 名前が変更され、改善されました。
使用例:
// この例は、PDF ドキュメントのテキスト内容を抽出する方法を示しています。
// TextExtractorOptions オブジェクトを作成して指示を設定します
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 処理を実行
var results = TextExtractor.Process(options);
// ResultContainer オブジェクトから抽出されたテキストを取得
var textExtracted = results.ResultCollection[0].ToString();
HTML コンバータの使いやすさ向上
- Class HtmlConverter: は静的で、コンストラクタを使用する必要はありません。
- Class HtmlConverter: メソッド Process における問題が修正されました。
- Class HtmlConverter: IDisposable ロジックが削除されました。
- Class PdfConverterOptions: 削除されました。
使用例:
// この例は、PDF を HTML ドキュメントに変換する方法を示しています。
// PdfToHtmlOptions オブジェクトを作成して出力データタイプを埋め込みリソース付きファイルに設定します
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_input.pdf"));
// 出力ファイルパスを設定
options.AddOutput(new FileDataSource("path_to_output.html"));
// 処理を実行
HtmlConverter.Process(options);
// この例は、HTML を PDF ドキュメントに変換する方法を示しています。
// HtmlToPdfOptions を作成
var options = new HtmlToPdfOptions();
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_input.html"));
// 出力ファイルパスを設定
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// 処理を実行
HtmlConverter.Process(options);
画像抽出ツールの使いやすさ向上
- Class ImageExtractor: は静的で、コンストラクタを使用する必要はありません。
使用例:
// この例は、PDF ドキュメントから画像を抽出する方法を示しています。
// 指示を設定するために ImageExtractorOptions を作成します
var options = new ImageExtractorOptions();
// 入力ファイルパスを追加
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// 出力ディレクトリパスを設定
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// 処理を実行
var results = ImageExtractor.Process(options);
// 画像結果へのパスを取得
var imageExtracted = results.ResultCollection[0].ToFile();
マイナー修正
- 内部修正。
- Tiff コンバータの例とヒントが修正されました。
- ページ最適化の時間が短縮されました。
- 修正: PDF から PNG への変換時に出力画像が不正確でした。
- 修正: PDF から PNG への変換時に中国語の文字が正しく表示されませんでした。
- 改善: PDF から HTML への変換時のパフォーマンス。