Suche Bestimmtes Wort in PDF mit Itextsharp

Dies ist mein Erster Beitrag in StackOverflow.

Ich habe eine PDF-Datei in meinem System-Laufwerk... ich möchte ein Programm schreiben in C# verwenden Itextsharp.dll Verweis, um nach einem Bestimmten Wort in einer PDF - ... sagen, ich will suchen "StackOverFlow"...
Wenn die PDF-Datei enthält das Wort "StackOverFlow" , es sollte true zurückgeben.

Sonst sollte es false zurück.

Habe ich in vielen Artikeln aber nicht die Lösung, bis jetzt ..:-(

Was ich versucht habe bis jetzt ist :

public string ReadPdfFile(string fileName)
        {
            StringBuilder text = new StringBuilder();

            if (File.Exists(fileName))
            {
                PdfReader pdfReader = new PdfReader(fileName);

                for (int page = 1; page <= pdfReader.NumberOfPages; page++)
                {
                    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
                    string currentText = "2154/MUM/2012 A";//PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);

                    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
                    text.Append(currentText);
                }
                pdfReader.Close();
            }
            return text.ToString();
        }

Vielen Dank im Voraus,
Sabya Dev

  • Sie haben PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy). Und Sie haben die Zeichenfolge, die Sie suchen. Haben Sie überprüft, ob Ihr Suchbegriff wird in das Ergebnis der GetTextFromPage Methode noch? Wenn nicht, hast du überprüft, was die Rückkehr der Methode sieht folgendermaßen aus (es IST ein string, nachdem alle)?
InformationsquelleAutor user2553159 | 2013-07-05
Schreibe einen Kommentar