v26.1
Nueva función: Extraer propiedades para el extractor de PDF
- Extraer propiedades PDF: Título, Autor, Asunto, Palabras clave, Número de páginas.
- Class Extractor: se añadió el método Extract para extraer propiedades PDF.
- Class ExtractPropertiesOptions: representa opciones de extracción de propiedades PDF para el complemento PdfExtractor.
- Class PdfProperties: representa propiedades e información meta del documento PDF.
- Interface IHaveInput: se utiliza para opciones con un único dato de entrada.
- Class OptionsWithInput: se utiliza para opciones con un único dato de entrada.
- Full Free functional.
Ejemplo de uso:
El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un archivo PDF.
// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ejemplo de uso:
El ejemplo muestra cómo extraer propiedades (Título, Autor, Asunto, Palabras clave, Número de páginas) de un flujo PDF.
// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;Ejemplo de uso:
El ejemplo muestra cómo extraer propiedades de un archivo PDF con el estilo más breve posible.
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));Mejoras
- Mejora de HTML a PDF que admite texto alternativo para imágenes
- Cumplimiento de PDF a PDFA1b
Errores corregidos
- Se produce un error al intentar optimizar un archivo PDF
- Problema de alineación vertical en campos de formulario
- Problema corregido al mostrar texto japonés en FormField
- HTML a PDF – Problema de formato de tabla
- Optimizar el tamaño del PDF antes de la conversión de PDF a PDF/A produce salida corrupta
- PDF a DOC – La tabla se renderiza incorrectamente
- PDF a Excel – Problemas de formato en el archivo de salida
- PDF a HTML – ArgumentException durante la conversión
- Conversión de PDF a HTML omite algunos enlaces
- Falta texto al convertir PDF a HTML