v25.7

Melhor usabilidade do Extrator de Texto

  • Class TextExtractor: é estática e não requer o uso de um construtor.
  • Class TextExtractor: comportamento melhorado ao rodar em modo de avaliação. Sem exceção com documentos de 4+ páginas.
  • Class TextExtractor: problemas corrigidos no método Process.
  • Class PdfExtractorOptions: removido.
  • Class TextExtractorOptions: refatorado.
  • Enum TextFormattingMode: renomeado e melhorado.

Exemplo de Uso:

// O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.
// Crie um objeto TextExtractorOptions para definir instruções
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Realize o processo
var results = TextExtractor.Process(options);
// Obtenha o texto extraído do objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Melhor usabilidade do Conversor Html

  • Class HtmlConverter: é estática e não requer o uso de um construtor.
  • Class HtmlConverter: problemas corrigidos no método Process.
  • Class HtmlConverter: lógica IDisposable removida.
  • Class PdfConverterOptions: removido.

Exemplos de Uso:

// O exemplo demonstra como converter PDF para documento HTML.
// Crie um objeto PdfToHtmlOptions para definir o tipo de dados de saída como arquivo com recursos incorporados
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Defina o caminho do arquivo de saída
options.AddOutput(new FileDataSource("path_to_output.html"));
// Realize o processo
HtmlConverter.Process(options);

// O exemplo demonstra como converter HTML para documento PDF.
// Crie HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_input.html"));
// Defina o caminho do arquivo de saída
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Realize o processo
HtmlConverter.Process(options);

Melhor usabilidade do Extrator de Imagem

  • Class ImageExtractor: é estática e não requer o uso de um construtor.

Exemplo de Uso:

// O exemplo demonstra como extrair imagens de um documento PDF.
// Crie ImageExtractorOptions para definir instruções
var options = new ImageExtractorOptions();
 // Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Defina o caminho do diretório de saída
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Realize o processo
var results = ImageExtractor.Process(options);
// Obtenha o caminho da imagem resultante
var imageExtracted = results.ResultCollection[0].ToFile();

Correções Menores

  • Correções internas.
  • Exemplos e dicas do Conversor Tiff corrigidos.
  • Duração de otimização de página minimizada.
  • Corrigido: imagem de saída incorreta na conversão de PDF para PNG.
  • Corrigido: caracteres chineses não exibidos corretamente durante a conversão de PDF para PNG.
  • Melhorado: Performance durante a conversão de PDF para HTML.
10 de jul. de 2025
 Português