v25.7

Улучшенная удобству использования Text Extractor

  • Class TextExtractor: статичен и не требует использования конструктора.
  • Class TextExtractor: улучшено поведение при работе в режиме оценки. Нет исключения при работе с документами на 4+ страницах.
  • Class TextExtractor: исправлены ошибки в методе Process.
  • Class PdfExtractorOptions: удалён.
  • Class TextExtractorOptions: переработан.
  • Enum TextFormattingMode: переименован и улучшен.

Пример использования:

// Пример демонстрирует, как извлечь текстовое содержимое PDF документа.
// Создайте объект TextExtractorOptions для установки инструкций
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Выполните процесс
var results = TextExtractor.Process(options);
// Получите извлечённый текст из объекта ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Улучшенная удобству использования Html Converter

  • Class HtmlConverter: статичен и не требует использования конструктора.
  • Class HtmlConverter: исправлены ошибки в методе Process.
  • Class HtmlConverter: удалена логика IDisposable.
  • Class PdfConverterOptions: удалён.

Примеры использования:

// Пример демонстрирует, как конвертировать PDF в HTML документ.
// Создайте объект PdfToHtmlOptions, чтобы установить тип выходных данных как файл с встроенными ресурсами
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.html"));
// Выполните процесс
HtmlConverter.Process(options);

// Пример демонстрирует, как конвертировать HTML в PDF документ.
// Создайте HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.html"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Выполните процесс
HtmlConverter.Process(options);

Улучшенная удобству использования Image Extractor

  • Class ImageExtractor: статичен и не требует использования конструктора.

Пример использования:

// Пример демонстрирует, как извлечь изображения из PDF документа.
// Создайте ImageExtractorOptions для установки инструкций
var options = new ImageExtractorOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установите путь к выходному каталогу
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Выполните процесс
var results = ImageExtractor.Process(options);
// Получите путь к результату изображения
var imageExtracted = results.ResultCollection[0].ToFile();

Небольшие исправления

  • Внутренние исправления.
  • Исправлены примеры и подсказки Tiff Converter.
  • Сокращено время оптимизации страниц.
  • Исправлено: неправильный вывод изображения при конвертации PDF в PNG.
  • Исправлено: китайские символы отображаются неправильно при конвертации PDF в PNG.
  • Улучшено: производительность при конвертации PDF в HTML.
 Русский