v26.1

Nueva función: Extraer propiedades para el extractor de PDF

  • Extraer propiedades PDF: Título, Autor, Asunto, Palabras clave, Número de páginas.
  • Class Extractor: se añadió el método Extract para extraer propiedades PDF.
  • Class ExtractPropertiesOptions: representa opciones de extracción de propiedades PDF para el complemento PdfExtractor.
  • Class PdfProperties: representa propiedades e información meta del documento PDF.
  • Interface IHaveInput: se utiliza para opciones con un único dato de entrada.
  • Class OptionsWithInput: se utiliza para opciones con un único dato de entrada.
  • Full Free functional.

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un archivo PDF.

// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un flujo PDF.

// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Ejemplo de uso:

El ejemplo muestra cómo extraer propiedades de un archivo PDF con el estilo más breve posible.

// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Mejoras

  • Mejora de HTML a PDF que admite texto alternativo para imágenes
  • Cumplimiento de PDF a PDFA1b

Errores corregidos

  • Se produce un error al intentar optimizar un archivo PDF
  • Problema de alineación vertical en campos de formulario
  • Problema corregido al mostrar texto japonés en FormField
  • HTML a PDF – Problema de formato de tabla
  • Optimizar el tamaño del PDF antes de la conversión de PDF a PDF/A produce salida corrupta
  • PDF a DOC – La tabla se renderiza incorrectamente
  • PDF a Excel – Problemas de formato en el archivo de salida
  • PDF a HTML – ArgumentException durante la conversión
  • Conversión de PDF a HTML omite algunos enlaces
  • Falta texto al convertir PDF a HTML
 Español