v25.7
- Class TextExtractor: es estático y no requiere el uso de un constructor.
- Class TextExtractor: comportamiento mejorado al ejecutarse en modo de evaluación. Sin excepción con documentos de más de 4 páginas.
- Class TextExtractor: se solucionaron problemas en el método Process.
- Class PdfExtractorOptions: eliminado.
- Class TextExtractorOptions: reestructurado.
- Enum TextFormattingMode: renombrado y mejorado.
Ejemplo de Uso:
// El ejemplo demuestra cómo extraer el contenido de texto de un documento PDF.
// Crear un objeto TextExtractorOptions para establecer instrucciones
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Realizar el proceso
var results = TextExtractor.Process(options);
// Obtener el texto extraído del objeto ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Mejora en la usabilidad del Conversor Html
- Class HtmlConverter: es estático y no requiere el uso de un constructor.
- Class HtmlConverter: se solucionaron problemas en el método Process.
- Class HtmlConverter: eliminada la lógica de IDisposable.
- Class PdfConverterOptions: eliminado.
Ejemplos de Uso:
// El ejemplo demuestra cómo convertir un PDF a un documento HTML.
// Crear un objeto PdfToHtmlOptions para establecer el tipo de datos de salida como archivo con recursos integrados
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Establecer ruta del archivo de salida
options.AddOutput(new FileDataSource("path_to_output.html"));
// Realizar el proceso
HtmlConverter.Process(options);
// El ejemplo demuestra cómo convertir un HTML a un documento PDF.
// Crear HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_input.html"));
// Establecer ruta del archivo de salida
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Realizar el proceso
HtmlConverter.Process(options);
- Class ImageExtractor: es estático y no requiere el uso de un constructor.
Ejemplo de Uso:
// El ejemplo demuestra cómo extraer imágenes de un documento PDF.
// Crear ImageExtractorOptions para establecer instrucciones
var options = new ImageExtractorOptions();
// Agregar ruta del archivo de entrada
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Establecer ruta del directorio de salida
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Realizar el proceso
var results = ImageExtractor.Process(options);
// Obtener la ruta de la imagen resultante
var imageExtracted = results.ResultCollection[0].ToFile();
Reparaciones Menores
- Reparaciones internas.
- Se corrigieron ejemplos y sugerencias del Conversor Tiff.
- Se minimizó la duración de la optimización de página.
- Corregido: imagen de salida incorrecta de conversión de PDF a PNG.
- Corregido: caracteres chinos no se mostraban correctamente durante la conversión de PDF a PNG.
- Mejorado: Rendimiento durante la conversión de PDF a HTML.