v24.5

Додано конвертор PDF/A для плагіна .NET

    var options = new PdfAConvertOptions
    {
        PdfAVersion = PdfAStandardVersion.PDF_A_3B
    };

    // Додати вихідний файл
    options.AddInput(new FileDataSource("path_to_your_pdf_file.pdf")); // замініть на фактичний шлях до вашого файлу

    // Додати шлях для збереження конвертованого файлу
    options.AddOutput(new FileDataSource("path_to_the_converted_file.pdf"));

    // Створити екземпляр плагіна
    var plugin = new PdfAConverter();

    // Виконати конвертацію
    plugin.Process(options);

Додано пошук за списком фраз

    var regexes = new Regex[]
    {
    new Regex(@"(?s)document\s+(?:(?:no\(?s?\)?\.?)|(?:number(?:\(?s\)?)?))\s+(?:(?:[\w-]*\d[\w-]*)+(?:[,;\s]|and)*)+", RegexOptions.IgnoreCase),
    new Regex(@"[\s\r\n]+Tract[\s\r\n]+of:?", RegexOptions.IgnoreCase),
    new Regex(@"vested[\s\r\n]+in", RegexOptions.IgnoreCase),
    new Regex("Vested in:", RegexOptions.IgnoreCase),
    new Regex(@"file.?[\s\r\n]+(?:nos?|numbers?|#s?|nums?).?[\s\r\n]+(\d+)-(\d+)", RegexOptions.IgnoreCase),
    new Regex(@"file.?[\s\r\n]+nos?.?:?[\s\r\n]+([\d\r\n-]+)", RegexOptions.IgnoreCase)
    };
    var document = new Document(input);
    var absorber = new TextFragmentAbsorber(
    regexes,
    new TextSearchOptions(true)
    );
    document.Pages.Accept(absorber);
    // Отримати результат
    var result = absorber.RegexResults
10 жовт. 2024 р.
 Українська