Wie kann ich die index-Dokumente in SOLR?
Im Laufenden Solr 1.4 unter Ubuntu 10.04 (installiert via apt-get solr-tomcat) und es scheint einwandfrei zu funktionieren. Im, mit einiger Mühe, eine kohärente Informationen, wie Dokumente indizieren, obwohl. Im neuen zu SOLR so mit mir tragen!
Ich habe einen Ordner (/mnt/Ordner), ist eine windows-Freigabe gemountet, enthält Word-und PDF-Dateien, die ich gerne indiziert, was ist der einfachste Weg, um SOLR index der ganze Ordner?
In der Dokumentation für SOLR ist ziemlich schlecht, seine impossilbe zu finden auf jedem anständigen tutorials auf getting things done, so dass jede Hilfe wird sehr geschätzt!
S
InformationsquelleAutor Shane | 2010-05-10
Du musst angemeldet sein, um einen Kommentar abzugeben.
Werfen Sie einen Blick auf die Solr-wiki, es ist eine ziemlich umfangreiche Dokumentation.
Insbesondere sehen die ExtractingRequestHandler, die Ihnen ermöglicht, index binäre Dateien wie Word-und PDF-Dokumente. Hier ist eine Einführung zu dem Thema.
Wenn das wiki ist nicht genug für Sie, es gibt auch eine tolles Buch über Solr.
Nur link zu dem Buch funktioniert
InformationsquelleAutor Mauricio Scheffer
Ich habe festgestellt, die gleichen Herausforderungen, die mit der core-Dokumentation, aber stieß ich auf dieses sehr nützliche Referenz-Handbuch von LucidImagination, die dazu beigetragen, eine Menge, was über SOLR:
http://docs.lucidworks.com/display/solr/Apache+Solr+Reference+Guide
Ich denke, dass das ersetzen der oben genannten: docs.lucidworks.com/display/solr/Apache+Solr+Reference+Guide
InformationsquelleAutor Jay Hung
Verarbeitung umfangreiche Dokumente mit Solr: http://wiki.apache.org/solr/UpdateRichDocuments
InformationsquelleAutor H6.