v25.7
- Class TextExtractor: статичен и не требует использования конструктора.
- Class TextExtractor: улучшено поведение при работе в режиме оценки. Нет исключения при работе с документами на 4+ страницах.
- Class TextExtractor: исправлены ошибки в методе Process.
- Class PdfExtractorOptions: удалён.
- Class TextExtractorOptions: переработан.
- Enum TextFormattingMode: переименован и улучшен.
Пример использования:
// Пример демонстрирует, как извлечь текстовое содержимое PDF документа.
// Создайте объект TextExtractorOptions для установки инструкций
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Выполните процесс
var results = TextExtractor.Process(options);
// Получите извлечённый текст из объекта ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Улучшенная удобству использования Html Converter
- Class HtmlConverter: статичен и не требует использования конструктора.
- Class HtmlConverter: исправлены ошибки в методе Process.
- Class HtmlConverter: удалена логика IDisposable.
- Class PdfConverterOptions: удалён.
Примеры использования:
// Пример демонстрирует, как конвертировать PDF в HTML документ.
// Создайте объект PdfToHtmlOptions, чтобы установить тип выходных данных как файл с встроенными ресурсами
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.html"));
// Выполните процесс
HtmlConverter.Process(options);
// Пример демонстрирует, как конвертировать HTML в PDF документ.
// Создайте HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_input.html"));
// Установите путь к выходному файлу
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Выполните процесс
HtmlConverter.Process(options);
- Class ImageExtractor: статичен и не требует использования конструктора.
Пример использования:
// Пример демонстрирует, как извлечь изображения из PDF документа.
// Создайте ImageExtractorOptions для установки инструкций
var options = new ImageExtractorOptions();
// Добавьте путь к входному файлу
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Установите путь к выходному каталогу
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Выполните процесс
var results = ImageExtractor.Process(options);
// Получите путь к результату изображения
var imageExtracted = results.ResultCollection[0].ToFile();
Небольшие исправления
- Внутренние исправления.
- Исправлены примеры и подсказки Tiff Converter.
- Сокращено время оптимизации страниц.
- Исправлено: неправильный вывод изображения при конвертации PDF в PNG.
- Исправлено: китайские символы отображаются неправильно при конвертации PDF в PNG.
- Улучшено: производительность при конвертации PDF в HTML.