Tag: lucene

Der Begriff Lucene bezieht sich auf die open-source-Java-Volltext-search-engine-Bibliothek, aber auch auf die gesamte eco-system, das wuchs um ihn herum, einschließlich lucene.net, solr, elasticsearch und zend-search-lucene.

Sollte ein index optimiert nach inkrementellen Indizes in Lucene?

Anzahl der Antworten 3 Antworten
Wir führen vollständige re-Indizes alle 7 Tage (D. H. erstellen Sie den index von Grund auf neu) auf unserer Lucene-index und inkrementelle Indizes alle 2 Stunden oder so. Unser index hat rund 700.000 Dokumente und eine vollständige

Was ist omitNorms und version-Feld in den solr-schema?

Anzahl der Antworten 1 Antworten
Ich bin nicht zu verstehen, Wann omitNorms="true". Lese ich 2-3 links, aber ich bin noch nicht klar mit seiner Bedeutung. was bedeutet es, "auf true Gesetzt weglassen der Normen im Zusammenhang mit diesem Bereich (dies deaktiviert die

ElasticSearch Fuzzy Query

Anzahl der Antworten 1 Antworten
Ich bin ganz neu auf ElasticSearchund bin derzeit auf der Erforschung seiner Funktionen. Einer von Ihnen, ich bin interessiert, ist die Fuzzy-Abfragedie ich testen und Probleme zu verwenden. Es ist wahrscheinlich eine dummy-Frage, also ich denke, jemand,

MongoDB Volltextsuche vs Lucene?

Anzahl der Antworten 2 Antworten
Wie funktioniert MongoDB ist die Volltextsuche miteinander vergleichen, um Lucene in der heutigen Zeit? Der Grund für die Frage ist durch meine Unbestimmtheit zu: a) mongo ' s FTS Umsetzung in der Produktion, da war es noch

LockObtainFailedException Aktualisierung der Lucene-such-index mit solr

Anzahl der Antworten 2 Antworten
Habe ich gegoogelt viel. Die meisten dieser Probleme werden verursacht durch eine Schleuse gelassen zu werden, um nach einen JVM-Absturz. Das ist nicht mein Fall. Habe ich einen index mit mehreren Lesern und Schreibern. Ich bin am

Wie man die Facette reicht im solr Ergebnisse?

Anzahl der Antworten 4 Antworten
Davon ausgehen, dass ich ein Feld namens Preis für die Dokumente in Solr und ich haben das Feld facettiert. Ich will den Facetten, wie die Bereiche von Werten (z.B.: 0-100, 100-500, 500-1000, etc). Wie es zu tun?

Mit RAMDirectory

Anzahl der Antworten 1 Antworten
Wann sollte ich verwenden Lucene ist RAMDirectory? Was sind seine Vorteile gegenüber anderen storage-Mechanismen? Schließlich, wo finde ich ein einfaches code Beispiel? InformationsquelleAutor der Frage Jimmy | 2009-03-23

Feld mit mehreren unterschiedlichen Werten

Anzahl der Antworten 3 Antworten
Bin ein "Book search" - API mit Lucene. Ich muss index buchname,Autor, Buch und Kategorie Felder im Lucene-index. Einem einzigen Buch fallen kann unter vielen verschiedenen Buch-Kategorien...zum Beispiel: BookName1 --fiction,Humor,Philosophie. BookName1 --fiction,Wissenschaft. BookName1 --Humor,business. BookName4-Humor und so

Wie Sortiere ich Lucene Ergebnisse von Feld-Wert mit einem HitCollector?

Anzahl der Antworten 4 Antworten
Ich bin mit dem folgenden code, um eine Abfrage ausführen, in Lucene.Net var collector = new GroupingHitCollector(searcher.GetIndexReader()); searcher.Search(myQuery, collector); resultsCount = collector.Hits.Count; Wie Sortiere ich diese Resultate basieren auf einem Feld? Update Danke für deine Antwort. Ich

Warum ist Solr so viel schneller als Postgres?

Anzahl der Antworten 5 Antworten
Ich habe vor kurzem umgestellt von Postgres zu Solr und sah eine ~50x Geschwindigkeit bis in unsere Abfragen. Die Abfragen laufen wir umfassen mehrere Bereiche, und unsere Daten Fahrzeug-Inserate. Zum Beispiel: "Finde alle Fahrzeuge mit der Laufleistung

Wie Suche ich ein int-Feld in Lucene 4?

Anzahl der Antworten 3 Antworten
Ich versuche zu implementieren ist ein index der Dokumente (rougly entsprechenden DB-Zeilen), wo einer der Felder ist eine ganze Zahl. Ich bin hinzufügen zum index wie: Document doc = new Document(); doc.add(new StringField("ticket_number", rs.getString("ticket_number"), Field.Store.YES)); doc.add(new IntField("ticket_id",

Hilfe wird gebraucht, herauszufinden, den Grund für maxClauseCount ist eingestellt auf 1024 Fehler

Anzahl der Antworten 4 Antworten
Habe ich zwei Sätze von such-Indizes. TestIndex (in unserer Testumgebung) und ProdIndex(in PRODUKTION). Lucene-Suchanfrage: +Datum:[20090410184806 ZU 20091007184806] funktioniert gut für test-index, sondern gibt diese Fehlermeldung für Prod index. "maxClauseCount auf 1024 festgelegt" Wenn ich ausführen folgende Zeile

Wie funktioniert Lucene Arbeit

Anzahl der Antworten 4 Antworten
Ich würde gerne herausfinden, wie die lucene-Suche funktioniert so schnell. Ich finde keine nützliche docs auf das web. Wenn Sie etwas haben, (kurz lucene-source-code) zu Lesen, lass es mich wissen. Einen text search-Abfrage, die mit mysql5 text-Suche

Zeigt den Inhalt des Lucene-index

Anzahl der Antworten 4 Antworten
Ich versuche zu Debuggen, die Indizierung der Dokumente in den Lucene, und ich muss sehen, dass die index-Inhalte, so kann ich genau sehen, wie die Dokumente bekam indiziert. Angeblich Luke tut dies, aber es gibt keine Dokumentation

Holen Sie sich Kosinus-ähnlichkeit zwischen zwei Dokumenten in lucene

Anzahl der Antworten 7 Antworten
ich gebaut habe, ein index in Lucene. Ich will, ohne Angabe einer Abfrage, nur um eine Partitur (Kosinus-ähnlichkeit oder eine andere Strecke?) zwischen zwei Dokumenten im index. Beispielsweise ich bin immer aus der vorher geöffneten IndexReader ir

Exakte Suche in array-Objekt Typ mit elasticsearch

Anzahl der Antworten 2 Antworten
Ich bin auf der Suche nach einem Weg, das zu tun genaue array entspricht in elastic search. Lassen Sie uns sagen, das sind meine Dokumente: {"id": 1, "categories" : ["c", "d"]} {"id": 2, "categories" : ["b", "c",

Indizierung von .PDF, .XLS, .DOC, .PPT mit Lucene.NET

Anzahl der Antworten 4 Antworten
Ich habe gehört, der Lucene.Net und ich habe gehört, der Apache Tika. Die Frage ist - wie kann ich index dieser Dokumente mit C# vs Java? Ich denke, das Problem ist, dass es keine .Net-äquivalent von Tika

Wie kann man den Lucene QueryParser fehlerverzeihender gestalten?

Anzahl der Antworten 6 Antworten
Ich bin mit Lucene.net aber ich bin tagging diese Frage für beide .NET-und Java-Versionen, weil die API ist die gleiche und ich bin der Hoffnung, dass es Lösungen gibt, die auf beiden Plattformen. Ich bin sicher, andere

Warum sind Dokumentspeicher wie Lucene / Solr nicht in NoSQL-Konversationen enthalten?

Anzahl der Antworten 6 Antworten
Alle haben uns über den letzten hype, no-SQL-Lösungen in letzter Zeit. MongoDB, CouchDB, BigTable, Cassandra, und andere haben auf die Liste der no-SQL-Optionen. Hier ist ein Beispiel: http://architects.dzone.com/articles/what-nosql-store-should-i-use Jedoch vor drei Jahren wurde ein Kollege und ich

Optimierung der Lucene-Leistung

Anzahl der Antworten 6 Antworten
Was sind die verschiedenen Möglichkeiten der Optimierung von Lucene-Leistung? Soll ich verwenden caching-API zum speichern der lucene search-Abfrage, so dass ich sparen den Aufwand der Erstellung der Abfrage wieder? InformationsquelleAutor der Frage user40907 | 2009-03-21

Lucenes Suchergebnisse durchsuchen

Anzahl der Antworten 1 Antworten
Ich bin mit Lucene zeigen die Suchergebnisse in einer web-Anwendung.Ich bin auch benutzerdefiniertes paging für die mit der gleichen. Suchen, könnten die Ergebnisse variieren von 5000 auf 10000 oder mehr. Kann mir bitte jemand sagen, die beste

Ist Solr für .Net verfügbar?

Anzahl der Antworten 5 Antworten
Ich will lernen, Solr. Darf ich wissen, ein paar gute Tutorials/links für? Auch, ist Solr zur Verfügung .NET? InformationsquelleAutor der Frage Ed. | 2009-11-17

Schnellere Suche in Lucene - Gibt es eine Möglichkeit, den gesamten Index im RAM zu halten?

Anzahl der Antworten 3 Antworten
Gibt es einen Weg, um den index im Arbeitsspeicher, anstatt halten Sie es auf der Festplatte? Sind, möchten wir die Suche schneller. InformationsquelleAutor der Frage elif | 2009-08-18

Solr / Solrj: Wie kann ich die Gesamtzahl der Dokumente in einem Index ermitteln?

Anzahl der Antworten 2 Antworten
Wie kann ich bestimmen, die Gesamtzahl der Dokumente in ein Solr-index mit Solrj? Nach Stunden des Suchens auf meiner eigenen, ich habe eigentlich eine Antwort (unten); ich bin nur dieses posting eine Frage, also können andere die

Ist ein Load Balancer mit ElasticSearch überflüssig?

Anzahl der Antworten 3 Antworten
Habe ich ein cluster von 3 ElasticSearch Knoten auf AWS EC2. Diese Knoten sind setup mit OpsWorks/Koch. Meine Absicht ist es, den Aufbau dieser cluster zu sein, sehr belastbar und elastisch (Knoten kommen in und out, wenn

Vergleich der Volltextsuchmaschine - Lucene, Sphinx, Postgresql, MySQL?

Anzahl der Antworten 8 Antworten
Baue ich eine Django-site und ich bin auf der Suche nach einer Suchmaschine. Ein paar Kandidaten: Lucene/Lucene mit Kompass/Solr Sphinx Postgresql integrierte Volltextsuche MySQl integrierten Volltextsuche Auswahlkriterien: Ergebnis Relevanz und ranking Suche und Indizierung Geschwindigkeit Benutzerfreundlichkeit und

Nested vs Objekt in Elasticsearch

Anzahl der Antworten 1 Antworten
Kann mir jemand erklären, was ist ein Unterschied zwischen "Objekt" und "nested" - Felder in Dokumente in Elasticsearch? Ich weiß durch die default-Feld ist definiert als Objekt. Ich weiß auch, dass ich access-Objekt-Feld mit einem Punkt wie

Ist es möglich, die in Lucene Index gespeicherten Dokumente zu durchlaufen?

Anzahl der Antworten 5 Antworten
Ich habe einige Dokumente in einem Lucene-index mit einer docId-Feld. Ich möchte alle docIds im index gespeichert. Es ist auch ein problem. Anzahl der Dokumente beträgt etwa 300 000, so würde ich lieber diese docIds in Blöcken

Gibt es eine gute Indexierung / Suchmaschine für Node.js?

Anzahl der Antworten 4 Antworten
Ich bin auf der Suche nach einem guten open-source - (mit LGPL oder eine freizügige Lizenz) - Indexierungs-engine für eine node.js Anwendung, so etwas wie Lucene. Ich bin auf der Suche nach in-Prozess-Indizierung und-Suche und bin nicht

Lucene Standard Analysator gegen Schneeball

Anzahl der Antworten 3 Antworten
Gerade erst angefangen mit Lucene.Net. Ich indizierten 100.000 Zeilen mit standard-analyzer, lief einige test-Abfragen, und bemerkte plural Abfragen nicht Ergebnisse zurück, wenn der ursprüngliche Begriff war einzigartig. Ich verstehe snowball analyzer fügt stemming-support, der gut klingt. Allerdings

Bestimmte Felder in einer Solr-Abfrage abrufen?

Anzahl der Antworten 5 Antworten
Ich arbeite mit einer Solr Instanz auf den Bootssteg und wenn ich die Suche mit der Solr admin-panel, gibt es das gesamte Dokument. Was muss ich tun um nur die angegebenen Felder aus jeder Solr-Dokument von der

Solr Partial und Full String Match

Anzahl der Antworten 4 Antworten
Ich versuche zu ermöglichen, sucht auf Teil-strings in Solr also, wenn jemand gesucht "ppopota" Sie hätten das gleiche Ergebnis erhalten, als wenn Sie gesucht für "Nilpferd." Ich Lesen Sie die Dokumentation, rauf und runter und fühle mich

Solr gegen ElasticSearch

Anzahl der Antworten 12 Antworten
Was sind die wichtigsten architektonischen Unterschiede zwischen diesen Technologien? Auch, was use cases sind in der Regel besser geeignet für jeden? InformationsquelleAutor der Frage Ben ODay | 2012-04-18

elasticsearch - Gibt die Token eines Feldes zurück

Anzahl der Antworten 2 Antworten
Wie kann ich das Token von einem bestimmten Bereich im Ergebnis zurückgegeben Beispielsweise EINE GET-Anfrage curl -XGET 'http://localhost:9200/twitter/tweet/1' gibt { "_index" : "twitter", "_type" : "tweet", "_id" : "1", "_source" : { "user" : "kimchy", "postDate" :

Ist Solr 4.0 in der Lage, Join für mehrere Kerns zu verwenden?

Anzahl der Antworten 1 Antworten
Ich merke, Solr 4.0 eingeführt hat, die "join" - Funktion für Dokumente mit Beziehungen. das ist großartig, aber ich merke Beispielen http://wiki.apache.org/solr/Join sind für single-core, die alle Dokumente sind im index. Weiß jemand, wenn ich "join" für

Wie machen Sie automatische Vervollständigung / Vorschläge in Lucene?

Anzahl der Antworten 5 Antworten
Ich bin auf der Suche nach einem Weg, das zu tun-Abfrage auto-Vervollständigung/Vorschläge in Lucene. Ich habe Gegoogelt um ein bisschen und spielte ein bisschen Rum, aber alle Beispiele, die ich gesehen habe scheinen einrichten von filtern in

Welche sind die besten Alternativen zu Lucene?

Anzahl der Antworten 9 Antworten
Es kann auf Unix und es wird verwendet für E-Mail-Suche (Dovecot, Postfix und maildir). Lucene ist kein problem, ich bin nur der Analyse einige alternativen. InformationsquelleAutor der Frage Rui Carneiro | 2009-03-02

ElasticSearch Analyzer und Tokenizer für E-Mails

Anzahl der Antworten 1 Antworten
Konnte ich nicht finden, eine perfekte Lösung, die entweder in Google oder ES für die folgende situation, hoffe hier jemand helfen könnte. Angenommen, es sind fünf E-Mail-Adressen gespeichert, unter Feld "E-Mail": 1. {"email": "[email protected]"} 2. {"email": "[email protected],

Gibt es eine reine Python Lucene?

Anzahl der Antworten 8 Antworten
Die ruby-Leute haben Frettchen. Sie jemand wissen, der eine ähnliche initiative für Python? Wir sind mit PyLucene auf aktuelle, aber ich würde gerne untersuchen, übergang zu reinen Python-Suche. InformationsquelleAutor der Frage PEZ | 2009-01-13

Wie führe ich mit QueryParser eine Lucene-Abfrage mit Sonderzeichen aus?

Anzahl der Antworten 2 Antworten
Hier ist die Sache. Ich habe einen Begriff im index gespeichert werden, enthält spezielle Zeichen wie '-', ist der einfachste code ist wie folgt: Document doc = new Document(); doc.add(new TextField("message", "1111-2222-3333", Field.Store.YES, Field.Index.NOT_ANALYZED)); writer.addDocument(doc); Und dann

Wie verwende ich einen Lucene Analyzer, um einen String zu tokenisieren?

Anzahl der Antworten 2 Antworten
Gibt es eine einfache Möglichkeit, die ich verwenden könnte jede Unterklasse von Lucene ist Analyzer zu analysieren/die tokenisierung ein String? Etwas wie: String to_be_parsed = "car window seven"; Analyzer analyzer = new StandardAnalyzer(...); List<String> tokenized_string = analyzer.analyze(to_be_parsed);

Solr - LockObtainFailedException bei mehreren gleichzeitigen Schreibvorgängen

Anzahl der Antworten 3 Antworten
Meine Anwendung nicht sehr Häufig solr schreibt von mehreren clients via REST. Ich bin mit dem autocommit-Funktion mit den "commitWithin" - Attribut. LockObtainFailedException zu starten, die nach einigen Tagen der Nutzung. Ich habe eine harte Zeit, herauszufinden,

Kibana fragt exakte Übereinstimmung ab

Anzahl der Antworten 4 Antworten
Ich würde gerne wissen, wie die Abfrage eines Feldes exakt eine Zeichenfolge. Eigentlich versuche ich, Abfrage wie diese: url : "http://www.domain_name.com" Gibt alle Strings beginnend mit http://www.domain_name.com . InformationsquelleAutor der Frage smace | 2014-09-08

Apache Lucene vs Google Search Appliance

Anzahl der Antworten 1 Antworten
Hat jemand mal wieder über die features von Apache Lucene? Ich habe gehört, es ist sogar vergleichbar mit der Google Search Appliance (GSA). Ich war auf der Suche für einen definitiven Vergleich zwischen den beiden, wenn möglich?

Best Practices für das durchsuchbare Archiv von Tausenden von Dokumenten (pdf und / oder XML)

Anzahl der Antworten 3 Antworten
Wiederaufgreifen einem ins stocken geratenen Projekt und suchen für die Beratung bei der Modernisierung Tausende von "alten" Dokumente und macht Sie über web. Dokumenten in verschiedenen Formaten, einige veraltete: (.docPageMakerhardcopy (OCR), PDFetc.). Die Mittel zur Migration der

Anfänger Lucene Tutorial

Anzahl der Antworten 6 Antworten
Habe ich noch nie etwas in Java vor, aber ich möchte die Lucene für die Suche auf einer Website. Ich habe Mühe finden Sie eine gute Schritt für Schritt Anleitung für einen kompletten Anfänger an. Kann jemand

Wie erstelle ich einen neuen Core in Solr 5?

Anzahl der Antworten 5 Antworten
Derzeit sind wir mit Apache Solr 4.10.3 ODER Heliosearch Distribution für Solr [HDS] als eine Suchmaschine zu indizieren unsere Daten. Nun nach, dass, ich habe die news über Apache Solr 5.0.0 release im letzten Monat. Ich würde

Lucene-Indexierung: Speicher- und Indexierungsmodi erklärt

Anzahl der Antworten 3 Antworten
Ich glaube, ich bin immer noch nicht zu verstehen, den lucene-index-Optionen. Den folgenden Optionen sind Store.Yes Store.No und Index.Tokenized Index.Un_Tokenized Index.No Index.No_Norms Ich nicht wirklich verstehen, die store-option. Warum würden Sie jemals wollen, NICHT speichern Sie Ihre

ElasticSearch - Suche nach menschlichen Namen

Anzahl der Antworten 1 Antworten
Ich habe eine große Datenbank mit Namen, vor allem aus Schottland. Wir produzieren derzeit einen Prototyp zu ersetzen, eine vorhandene software, die führt die Suche. Dies ist noch in der Produktion und wir sind mit dem Ziel,

Wie bekomme ich ein Token von einem Lucene TokenStream?

Anzahl der Antworten 4 Antworten
Ich versuche, Apache Lucene für die tokenisierung, und ich bin ratlos das Verfahren zur Erlangung der Token von einem TokenStream. Das Schlimmste ist, dass ich freue mich auf die Kommentare in den JavaDocs, die Adresse meine Frage.