v26.1

Nueva función: Extraer propiedades para el extractor de PDF

Extraer propiedades PDF: Título, Autor, Asunto, Palabras clave, Número de páginas.
Class Extractor: se añadió el método Extract para extraer propiedades PDF.
Class ExtractPropertiesOptions: representa opciones de extracción de propiedades PDF para el complemento PdfExtractor.
Class PdfProperties: representa propiedades e información meta del documento PDF.
Interface IHaveInput: se utiliza para opciones con un único dato de entrada.
Class OptionsWithInput: se utiliza para opciones con un único dato de entrada.
Full Free functional.

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un archivo PDF.

// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un flujo PDF.

// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades de un archivo PDF con el estilo más breve posible.

// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Mejoras

Mejora de HTML a PDF que admite texto alternativo para imágenes
Cumplimiento de PDF a PDFA1b

Errores corregidos

Se produce un error al intentar optimizar un archivo PDF
Problema de alineación vertical en campos de formulario
Problema corregido al mostrar texto japonés en FormField
HTML a PDF – Problema de formato de tabla
Optimizar el tamaño del PDF antes de la conversión de PDF a PDF/A produce salida corrupta
PDF a DOC – La tabla se renderiza incorrectamente
PDF a Excel – Problemas de formato en el archivo de salida
PDF a HTML – ArgumentException durante la conversión
Conversión de PDF a HTML omite algunos enlaces
Falta texto al convertir PDF a HTML