v25.7
Peningkatan Kegunaan Pengambilan Teks
- Class TextExtractor: bersifat statis dan tidak memerlukan penggunaan konstruktor.
- Class TextExtractor: Perilaku yang ditingkatkan saat menjalankan dalam mode evaluasi. Tidak ada pengecualian untuk dokumen dengan lebih dari 4 halaman.
- Class TextExtractor: masalah dalam metode Process telah diperbaiki.
- Class PdfExtractorOptions: dihapus.
- Class TextExtractorOptions: dirombak.
- Enum TextFormattingMode: diganti nama dan ditingkatkan.
Contoh Penggunaan:
// Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.
// Buat objek TextExtractorOptions untuk mengatur instruksi
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Lakukan proses
var results = TextExtractor.Process(options);
// Ambil teks yang diekstrak dari objek ResultContainer
var textExtracted = results.ResultCollection[0].ToString();
Peningkatan Kegunaan Pengonversi Html
- Class HtmlConverter: bersifat statis dan tidak memerlukan penggunaan konstruktor.
- Class HtmlConverter: masalah dalam metode Process telah diperbaiki.
- Class HtmlConverter: logika IDisposable dihapus.
- Class PdfConverterOptions: dihapus.
Contoh Penggunaan:
// Contoh ini menunjukkan cara mengonversi PDF ke dokumen HTML.
// Buat objek PdfToHtmlOptions untuk mengatur jenis data keluaran sebagai file dengan sumber daya yang disematkan
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Atur jalur file keluaran
options.AddOutput(new FileDataSource("path_to_output.html"));
// Lakukan proses
HtmlConverter.Process(options);
// Contoh ini menunjukkan cara mengonversi HTML ke dokumen PDF.
// Buat HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_input.html"));
// Atur jalur file keluaran
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Lakukan proses
HtmlConverter.Process(options);
Peningkatan Kegunaan Pengambilan Gambar
- Class ImageExtractor: bersifat statis dan tidak memerlukan penggunaan konstruktor.
Contoh Penggunaan:
// Contoh ini menunjukkan cara mengekstrak gambar dari dokumen PDF.
// Buat ImageExtractorOptions untuk mengatur instruksi
var options = new ImageExtractorOptions();
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Atur jalur Direktori keluaran
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Lakukan proses
var results = ImageExtractor.Process(options);
// Ambil jalur ke hasil gambar
var imageExtracted = results.ResultCollection[0].ToFile();
Perbaikan Kecil
- Perbaikan internal.
- Contoh dan petunjuk Pengonversi Tiff sudah diperbaiki.
- Durasi optimasi halaman diminimalkan.
- Diperbaiki: gambar keluaran yang tidak tepat dari konversi PDF ke PNG.
- Diperbaiki: karakter Cina tidak ditampilkan dengan benar selama konversi PDF ke PNG.
- Ditingkatkan: Performa selama konversi PDF ke HTML.