v26.1

Novo Recurso Extrair Propriedades para o PDF Extractor

  • Extrair Propriedades do PDF: Título, Autor, Assunto, Palavras‑chave, Número de Páginas.
  • Class Extractor: método Extract adicionado para extrair as Propriedades do PDF.
  • Class ExtractPropertiesOptions: representa as opções de extração de propriedades do PDF para o plugin PdfExtractor.
  • Class PdfProperties: representa as propriedades e informações de metadados do documento PDF.
  • Interface IHaveInput: usada para Opções com um único dado de entrada.
  • Class OptionsWithInput: usada para Opções com um único dado de entrada.
  • Full Free functional.

Exemplo de Uso:

O exemplo demonstra como extrair Propriedades (Título, Autor, Assunto, Palavras‑chave, Número de Páginas) de um arquivo PDF.

// Create ExtractPropertiesOptions object to set input file
var options = new ExtractPropertiesOptions("path_to_your_pdf_file.pdf");
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Exemplo de Uso:

O exemplo demonstra como extrair Propriedades (Título, Autor, Assunto, Palavras‑chave, Número de Páginas) de um fluxo (stream) PDF.

// Create ExtractPropertiesOptions object to set input stream
var stream = File.OpenRead("path_to_your_pdf_file.pdf");
var options = new ExtractPropertiesOptions(stream);
// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(options);
var title = pdfProperties.Title;
var author = pdfProperties.Author;
var subject = pdfProperties.Subject;
var keywords = pdfProperties.Keywords;
var numberOfPages = pdfProperties.NumberOfPages;

Exemplo de Uso:

O exemplo demonstra como extrair Propriedades de um arquivo PDF da forma mais curta possível.

// Perform the process and get Properties
var pdfProperties = PdfExtractor.Extract(new ExtractPropertiesOptions("path_to_your_pdf_file.pdf"));

Melhorias

  • A melhoria de HTML para PDF agora suporta texto alternativo para imagens
  • Conformidade PDF para PDFA1b

Bugs Corrigidos

  • Erro ao tentar otimizar o arquivo PDF
  • Problema de alinhamento vertical de campos de formulário
  • Problema corrigido na exibição de texto em japonês em FormField
  • HTML para PDF – Problema de formatação de tabela
  • Otimizar o tamanho do PDF antes da conversão para PDF/A resultava em saída corrompida
  • PDF para DOC – Tabela renderizada incorretamente
  • PDF para Excel – Problemas de formatação no arquivo de saída
  • PDF para HTML – ArgumentException durante a conversão
  • Conversão de PDF para HTML perdeu alguns links
  • Texto faltando ao converter PDF para HTML
 Português