v25.7
- Class TextExtractor: é estática e não requer o uso de um construtor.
- Class TextExtractor: comportamento melhorado ao rodar em modo de avaliação. Sem exceção com documentos de 4+ páginas.
- Class TextExtractor: problemas corrigidos no método Process.
- Class PdfExtractorOptions: removido.
- Class TextExtractorOptions: refatorado.
- Enum TextFormattingMode: renomeado e melhorado.
Exemplo de Uso:
// O exemplo demonstra como extrair o conteúdo de texto de um documento PDF.
// Crie um objeto TextExtractorOptions para definir instruções
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Realize o processo
var results = TextExtractor.Process(options);
// Obtenha o texto extraído do objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Melhor usabilidade do Conversor Html
- Class HtmlConverter: é estática e não requer o uso de um construtor.
- Class HtmlConverter: problemas corrigidos no método Process.
- Class HtmlConverter: lógica IDisposable removida.
- Class PdfConverterOptions: removido.
Exemplos de Uso:
// O exemplo demonstra como converter PDF para documento HTML.
// Crie um objeto PdfToHtmlOptions para definir o tipo de dados de saída como arquivo com recursos incorporados
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Defina o caminho do arquivo de saída
options.AddOutput(new FileDataSource("path_to_output.html"));
// Realize o processo
HtmlConverter.Process(options);
// O exemplo demonstra como converter HTML para documento PDF.
// Crie HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_input.html"));
// Defina o caminho do arquivo de saída
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Realize o processo
HtmlConverter.Process(options);
- Class ImageExtractor: é estática e não requer o uso de um construtor.
Exemplo de Uso:
// O exemplo demonstra como extrair imagens de um documento PDF.
// Crie ImageExtractorOptions para definir instruções
var options = new ImageExtractorOptions();
// Adicione o caminho do arquivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Defina o caminho do diretório de saída
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Realize o processo
var results = ImageExtractor.Process(options);
// Obtenha o caminho da imagem resultante
var imageExtracted = results.ResultCollection[0].ToFile();
Correções Menores
- Correções internas.
- Exemplos e dicas do Conversor Tiff corrigidos.
- Duração de otimização de página minimizada.
- Corrigido: imagem de saída incorreta na conversão de PDF para PNG.
- Corrigido: caracteres chineses não exibidos corretamente durante a conversão de PDF para PNG.
- Melhorado: Performance durante a conversão de PDF para HTML.