v25.12
Новый плагин PDF Form
- Class PdfForm: содержит все функции плагинов: FormFlattener, FormExporter. Также позволяет удалять и получать поля.
- Class FormFlattener: будет удалён в ближайшее время, используйте PdfForm.
- Class FormFlattenerOptions: переименован в Class FlattenFieldsOptions.
- Class GetFieldNamesOptions: позволяет задавать параметры для получения имён полей.
- Class RemoveFieldsOptions: позволяет задавать параметры для удаления полей.
- Смотрите The New Plugin Architecture.
Example Usage:
Пример демонстрирует, как выполнить Flatten полей в PDF‑файле.
// Create FlattenFieldsOptions object to set instructions
var options = new FlattenFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Flatten(options);Example Usage:
Пример демонстрирует, как получить имена полей из PDF‑файла.
var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));Example Usage:
Пример демонстрирует, как экспортировать значения формы в CSV‑файл.
// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfForm.Extract(options);Example Usage:
Пример демонстрирует, как удалить поля из PDF‑файла.
// Create RemoveFieldsOptions object to set instructions
var options = new RemoveFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Remove(options);Изменения в PDF Extractor
- Method ExtractText: переименован в Method Extract.
- Method ExtractImages: переименован в Method Extract.
- Method ExtractFormData: переименован в Method Extract.
Example Usage:
Пример демонстрирует, как извлечь текстовое содержимое PDF‑документа.
// Create ExtractTextOptions object to set instructions
var options = new ExtractTextOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get the extracted text from the ResultContainer object
var textExtracted = results.ResultCollection[0].ToString();Example Usage:
Пример демонстрирует, как извлечь изображения из PDF‑документа.
// Create ExtractImagesOptions to set instructions
var options = new ExtractImagesOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output Directory path
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get path to image result
var imageExtracted = results.ResultCollection[0].ToFile();Example Usage:
Пример демонстрирует, как экспортировать значения формы в CSV‑файл.
// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfExtractor.Extract(options);Улучшения
- Class PdfConverterOptions, PdfToXlsOptions - использовать Class PluginBaseOptions
- Конверсия в PDF/A-1b
- Конверсия в PDF/A-2b
Исправленные ошибки
- Исправлены проблемы форматирования при конвертации HTML в PDF
- При конвертации PDF в HTML некоторые ссылки пропадали