v25.7

Peningkatan Kegunaan Pengambilan Teks

  • Class TextExtractor: bersifat statis dan tidak memerlukan penggunaan konstruktor.
  • Class TextExtractor: Perilaku yang ditingkatkan saat menjalankan dalam mode evaluasi. Tidak ada pengecualian untuk dokumen dengan lebih dari 4 halaman.
  • Class TextExtractor: masalah dalam metode Process telah diperbaiki.
  • Class PdfExtractorOptions: dihapus.
  • Class TextExtractorOptions: dirombak.
  • Enum TextFormattingMode: diganti nama dan ditingkatkan.

Contoh Penggunaan:

// Contoh ini menunjukkan cara mengekstrak konten teks dari dokumen PDF.
// Buat objek TextExtractorOptions untuk mengatur instruksi
var options = new TextExtractorOptions(TextFormattingMode.Pure);
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Lakukan proses
var results = TextExtractor.Process(options);
// Ambil teks yang diekstrak dari objek ResultContainer
var textExtracted = results.ResultCollection[0].ToString();

Peningkatan Kegunaan Pengonversi Html

  • Class HtmlConverter: bersifat statis dan tidak memerlukan penggunaan konstruktor.
  • Class HtmlConverter: masalah dalam metode Process telah diperbaiki.
  • Class HtmlConverter: logika IDisposable dihapus.
  • Class PdfConverterOptions: dihapus.

Contoh Penggunaan:

// Contoh ini menunjukkan cara mengonversi PDF ke dokumen HTML.
// Buat objek PdfToHtmlOptions untuk mengatur jenis data keluaran sebagai file dengan sumber daya yang disematkan
var options = new PdfToHtmlOptions(PdfToHtmlOptions.SaveDataType.FileWithEmbeddedResources);
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_input.pdf"));
// Atur jalur file keluaran
options.AddOutput(new FileDataSource("path_to_output.html"));
// Lakukan proses
HtmlConverter.Process(options);

// Contoh ini menunjukkan cara mengonversi HTML ke dokumen PDF.
// Buat HtmlToPdfOptions
var options = new HtmlToPdfOptions();
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_input.html"));
// Atur jalur file keluaran
options.AddOutput(new FileDataSource("path_to_output.pdf"));
// Lakukan proses
HtmlConverter.Process(options);

Peningkatan Kegunaan Pengambilan Gambar

  • Class ImageExtractor: bersifat statis dan tidak memerlukan penggunaan konstruktor.

Contoh Penggunaan:

// Contoh ini menunjukkan cara mengekstrak gambar dari dokumen PDF.
// Buat ImageExtractorOptions untuk mengatur instruksi
var options = new ImageExtractorOptions();
// Tambahkan jalur file input
options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf"));
// Atur jalur Direktori keluaran
options.AddOutput(new DirectoryDataSource("path_to_results_directory"));
// Lakukan proses
var results = ImageExtractor.Process(options);
// Ambil jalur ke hasil gambar
var imageExtracted = results.ResultCollection[0].ToFile();

Perbaikan Kecil

  • Perbaikan internal.
  • Contoh dan petunjuk Pengonversi Tiff sudah diperbaiki.
  • Durasi optimasi halaman diminimalkan.
  • Diperbaiki: gambar keluaran yang tidak tepat dari konversi PDF ke PNG.
  • Diperbaiki: karakter Cina tidak ditampilkan dengan benar selama konversi PDF ke PNG.
  • Ditingkatkan: Performa selama konversi PDF ke HTML.
 Indonesia