Mit Volltext-Suche mit PDF-Dateien in SQL Server 2005

Ich habe ein seltsames problem mit der Indizierung von PDF-Dateien in SQL Server 2005, und hoffe, mir kann jemand helfen. Meine Datenbank hat eine Tabelle namens MediaFile mit den folgenden Feldern - MediaFileId int identity pk, FileContent Bild, und Dateierweiterung varchar(5). Ich habe meine web-Anwendung speichern der Inhalt der Datei in diese Tabelle ohne Probleme, und bin in der Lage, verwenden Sie die Volltextsuche auf doc, xls, etc ohne Probleme - nur die Datei-Erweiterung nicht funktioniert, ist die PDF-Datei. Bei der Durchführung von volltextsuchen in dieser Tabelle für die Worte, die ich weiß, gibt es in der PDF-Dateien gespeichert in der Tabelle sind diese Dateien nicht in den Suchergebnissen zurückgegeben.

Das OS ist Windows Server 2003 SP2, und ich habe installiert Adobe iFilter 6.0. Folgen Sie den Anweisungen auf dieser blog-Eintrag, ich ausgeführt die folgenden Befehle:

exec sp_fulltext_service 'load_os_resources', 1;
exec sp_fulltext_service 'verify_signature', 0;

Nachdem dieser neu gestartet ich den SQL Server, und verifiziert, dass die iFilter für das PDF-Erweiterungen korrekt installiert ist, indem Sie den folgenden Befehl ausführen:

select document_type, path from sys.fulltext_document_types where document_type = '.pdf' 

Dieser gibt die folgenden Informationen zurück, die korrekt aussieht:

document_type: .pdf

Pfad: C:\Program Dateien\Adobe PDF IFilter 6.0\PDFFILT.dll

Dann habe ich (wieder)erstellt den index auf das MediaFile Tabelle auswählen, FileContent, als die Spalte zu indizieren und die FileExtension als seinen Typ. Der Assistent erstellt den index und erfolgreich abgeschlossen. Um zu testen, ich bin der Durchführung einer Suche wie dieser:

SELECT MediaFileId, FileExtension FROM MediaFile WHERE CONTAINS(*, '"house"');

Zurück DOC-Dateien, die enthalten mit diesem Begriff, aber nicht alle PDF-Dateien, obwohl ich weiß, dass es definitiv von PDF-Dateien in der Tabelle, die das Wort enthalten Haus.

Übrigens, ich habe diese Arbeit einmal für ein paar Minuten, in denen die Suche oben kehrte die richtigen PDF-Dateien, aber dann es gerade aufgehört zu arbeiten wieder ohne ersichtlichen Grund.

Alle Ideen, was könnte das anhalten der SQL Server 2005-von der Indizierung der PDF ' s, auch wenn Adobe iFilter installiert ist und angezeigt wird, geladen werden?

InformationsquelleAutor Mun | 2008-11-07
Schreibe einen Kommentar