v25.7

Улучшенная удобству использования Text Extractor

Class TextExtractor: статичен и не требует использования конструктора.
Class TextExtractor: улучшено поведение при работе в режиме оценки. Нет исключения при работе с документами на 4+ страницах.
Class TextExtractor: исправлены ошибки в методе Process.
Class PdfExtractorOptions: удалён.
Class TextExtractorOptions: переработан.
Enum TextFormattingMode: переименован и улучшен.

Пример использования:

// Пример демонстрирует, как извлечь текстовое содержимое PDF документа.
// Создайте объект TextExtractorOptions для установки инструкций
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Выполните процесс
var results = TextExtractor.Process(options);
// Получите извлечённый текст из объекта ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Улучшенная удобству использования Html Converter

Class HtmlConverter: статичен и не требует использования конструктора.
Class HtmlConverter: исправлены ошибки в методе Process.
Class HtmlConverter: удалена логика IDisposable.
Class PdfConverterOptions: удалён.

Примеры использования:

// Пример демонстрирует, как конвертировать PDF в HTML документ.
// Создайте объект PdfToHtmlOptions, чтобы установить тип выходных данных как файл с встроенными ресурсами
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.html"));
// Выполните процесс
HtmlConverter.Process(options);

// Пример демонстрирует, как конвертировать HTML в PDF документ.
// Создайте HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.html"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Выполните процесс
HtmlConverter.Process(options);

Улучшенная удобству использования Image Extractor

Class ImageExtractor: статичен и не требует использования конструктора.

Пример использования:

// Пример демонстрирует, как извлечь изображения из PDF документа.
// Создайте ImageExtractorOptions для установки инструкций
var options = new ImageExtractorOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установите путь к выходному каталогу
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Выполните процесс
var results = ImageExtractor.Process(options);
// Получите путь к результату изображения
var imageExtracted = results.ResultCollection[0].ToFile();

Небольшие исправления

Внутренние исправления.
Исправлены примеры и подсказки Tiff Converter.
Сокращено время оптимизации страниц.
Исправлено: неправильный вывод изображения при конвертации PDF в PNG.
Исправлено: китайские символы отображаются неправильно при конвертации PDF в PNG.
Улучшено: производительность при конвертации PDF в HTML.