v25.7

Mejora en la usabilidad del Extractor de Texto

  • Class TextExtractor: es estático y no requiere el uso de un constructor.
  • Class TextExtractor: comportamiento mejorado al ejecutarse en modo de evaluación. Sin excepción con documentos de más de 4 páginas.
  • Class TextExtractor: se solucionaron problemas en el método Process.
  • Class PdfExtractorOptions: eliminado.
  • Class TextExtractorOptions: reestructurado.
  • Enum TextFormattingMode: renombrado y mejorado.

Ejemplo de Uso:

// El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.
// Crear un objeto TextExtractorOptions para establecer instrucciones
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Realizar el proceso
var results = TextExtractor.Process(options);
// Obtener el texto extraído del objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Mejora en la usabilidad del Conversor Html

  • Class HtmlConverter: es estático y no requiere el uso de un constructor.
  • Class HtmlConverter: se solucionaron problemas en el método Process.
  • Class HtmlConverter: eliminada la lógica de IDisposable.
  • Class PdfConverterOptions: eliminado.

Ejemplos de Uso:

// El ejemplo demuestra cómo convertir un PDF a un documento HTML.
// Crear un objeto PdfToHtmlOptions para establecer el tipo de datos de salida como archivo con recursos integrados
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Establecer ruta del archivo de salida
options.AddOutput(new FileDataSource("path_to_output.html"));
// Realizar el proceso
HtmlConverter.Process(options);

// El ejemplo demuestra cómo convertir un HTML a un documento PDF.
// Crear HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_input.html"));
// Establecer ruta del archivo de salida
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Realizar el proceso
HtmlConverter.Process(options);

Mejora en la usabilidad del Extractor de Imágenes

  • Class ImageExtractor: es estático y no requiere el uso de un constructor.

Ejemplo de Uso:

// El ejemplo demuestra cómo extraer imágenes de un documento PDF.
// Crear ImageExtractorOptions para establecer instrucciones
var options = new ImageExtractorOptions();
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Establecer ruta del directorio de salida
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Realizar el proceso
var results = ImageExtractor.Process(options);
// Obtener la ruta de la imagen resultante
var imageExtracted = results.ResultCollection[0].ToFile();

Reparaciones Menores

  • Reparaciones internas.
  • Se corrigieron ejemplos y sugerencias del Conversor Tiff.
  • Se minimizó la duración de la optimización de página.
  • Corregido: imagen de salida incorrecta de conversión de PDF a PNG.
  • Corregido: caracteres chinos no se mostraban correctamente durante la conversión de PDF a PNG.
  • Mejorado: Rendimiento durante la conversión de PDF a HTML.
10 jul. 2025
 Español