v25.12

Nuevo plugin PDF Form

  • Class PdfForm: contiene todas las funciones de los complementos: FormFlattener, FormExporter. También permite eliminar y obtener campos.
  • Class FormFlattener: será eliminado pronto, use PdfForm.
  • Class FormFlattenerOptions: renombrado a Class FlattenFieldsOptions.
  • Class GetFieldNamesOptions: permite establecer opciones para obtener nombres de campos.
  • Class RemoveFieldsOptions: permite establecer opciones para eliminar campos.
  • Ver The New Plugin Architecture.

Ejemplo de uso:

El ejemplo muestra cómo aplanar (Flatten) campos en un archivo PDF.

// Create FlattenFieldsOptions object to set instructions
var options = new FlattenFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Flatten(options);

Ejemplo de uso:

El ejemplo muestra cómo obtener los nombres de los campos de un archivo PDF.

var fieldNames = PdfForm.GetNames(new GetFieldNamesOptions("path_to_your_pdf_file.pdf"));

Ejemplo de uso:

El ejemplo muestra cómo exportar los valores del formulario a un archivo CSV.

// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfForm.Extract(options);

Ejemplo de uso:

El ejemplo muestra cómo eliminar campos de un archivo PDF.

// Create RemoveFieldsOptions object to set instructions
var options = new RemoveFieldsOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_pdf_file.pdf"));
// Perform the process
PdfForm.Remove(options);

Cambios en PDF Extractor

  • Method ExtractText: renombrado a Method Extract.
  • Method ExtractImages: renombrado a Method Extract.
  • Method ExtractFormData: renombrado a Method Extract.

Ejemplo de uso:

El ejemplo muestra cómo extraer el contenido de texto de un documento PDF.

// Create ExtractTextOptions object to set instructions
var options = new ExtractTextOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get the extracted text from the ResultContainer object
var textExtracted = results.ResultCollection[0].ToString();

Ejemplo de uso:

El ejemplo muestra cómo extraer imágenes de un documento PDF.

// Create ExtractImagesOptions to set instructions
var options = new ExtractImagesOptions();
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output Directory path
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Perform the process
var results = PdfExtractor.Extract(options);
// Get path to image result
var imageExtracted = results.ResultCollection[0].ToFile();

Ejemplo de uso:

El ejemplo muestra cómo exportar los valores del formulario a un archivo CSV.

// Create ExtractFormDataToDsvOptions object to set instructions
var options = new ExtractFormDataToDsvOptions(',', true);
// Add input file path
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Set output file path
options.AddOutput(new FileDataSource("path_to_result_csv_file.csv"));
// Perform the process
PdfExtractor.Extract(options);

Mejoras

  • Class PdfConverterOptions, PdfToXlsOptions - usar Class PluginBaseOptions
  • Conversión a PDF/A-1b
  • Conversión a PDF/A-2b

Errores corregidos

  • Se corrigieron problemas de formato en la conversión de HTML a PDF.
  • La conversión de PDF a HTML perdió algunos enlaces.
 Español