Tag: lucene

Der Begriff Lucene bezieht sich auf die open-source-Java-Volltext-search-engine-Bibliothek, aber auch auf die gesamte eco-system, das wuchs um ihn herum, einschließlich lucene.net, solr, elasticsearch und zend-search-lucene.

Situationen zu bevorzugen, Apache Lucene über Solr?

Anzahl der Antworten 5 Antworten
Es gibt mehrere Vorteile zum verwenden Solr 1.4 (out-of-the-box facetting such -, Gruppierungs -, Replikations -, http-administration vs. Lukas, ...). Selbst wenn ich das embed-search-Funktionalität in meine Java-Anwendung, die ich verwenden könnte SolrJ zu vermeiden, die HTTP

Was ist die Verwendung von Feld.Set OmitNorms(true); in lucene

Anzahl der Antworten 2 Antworten
Ich habe vorgeschlagen worden, um Feld verwenden.Set OmitNorms(true); beim erstellen der Dokumente für lucenesearch zu Sortieren das Ergebnis nach der Anzahl der Treffer, aber ich bin nicht klar, was es tut und ist es sicher. Sortieren Sie

SOLR HTTP 500 Kann nicht finden die Ressource 'solrconfig.xml'

Anzahl der Antworten 1 Antworten
Ich habe Apache SOLR arbeiten mit ColdFusion-auf meiner lokalen Maschine, aber wenn ich versuchte, um den Umstieg auf die Produktion (- Umgebungen sind unterschiedlich), ich erhalte die HTTP 500 Meldung unten. Produktion-Umgebung mit Ubuntu Lucid, Apache, ColdFusion

Multi-Feld, multi-word -, Spiel ohne query_string

Anzahl der Antworten 4 Antworten
Ich würde gerne in der Lage, mit einer multi-word-Suche mit mehreren Feldern, wo jedes Wort, das gesucht ist enthalten in alle der Felder, beliebige Kombination. Der Haken ist, ich möchte vermeiden Sie die Verwendung query_string. curl -X

Lucene: so erstellen Sie einen Datumsbereich Abfrage programmatisch?

Anzahl der Antworten 1 Antworten
Mithilfe von Lucene 4.2.1 API, ich brauche ein äquivalent +fieldname:[2013-01-17T00:00:00Z ZU *] konstruiert programmgesteuert. Spähte ich in TermRangeQuery und NumericRangeQuery aber nicht in der Lage zu kommen mit eine schnelle Lösung. mögliche Duplikate von Lucene-Query auf eine

Bauen Sie ein Kibana Histogramm-buckets dynamisch erstellt von ElasticSearch Begriffe aggregation

Anzahl der Antworten 2 Antworten
Ich möchte in der Lage sein zu kombinieren die Funktionalität der Kibana Begriffe Graph (können buckets zu erstellen, basierend auf Einmaligkeit der Werte aus einem bestimmten Attribut) und Histogramm (separate Daten in buckets anhand von Abfragen und

Installation von solr und Indizierung, mysql

Anzahl der Antworten 4 Antworten
Kann mir jemand helfen mit der Installation von solr konfigurieren, dass Sie mysql-Tabelle.Ich Habe versucht, fast alle tutorials , die ich habe versucht, mit Bootsanleger , auch für tomcat.Noch immer Fehler wie Daten-Handler nicht definiert oder konnte

Unterschied zwischen FSDirectory-und MMap-Verzeichnis?

Anzahl der Antworten 2 Antworten
Kann einer mir erklären was ist der Unterschied zwischen FSDirectory und MMapDirectory? Ich möchte zum Aufwärmen meinem cache. Ich habe gelesen, dass das nützlich sein könnte, konnte aber nichts finden, wie dies wird hilfreich sein bei der

wie bauen web-crawler verwenden asp.net mvc3 und c#?

Anzahl der Antworten 1 Antworten
Ich brauchen, um zu bauen die kleine Suchmaschine wie Google verwenden ASP.NET MVC-3. Für diese hier habe ich auch zum erstellen der web-crawler, die füllen Sie die Daten für die Suchmaschine. In Zusammenfassung, die ich benötigen die

Ich löschte die default-Solr-Kollektion, die durch Fehler der Solr Admin-UI

Anzahl der Antworten 2 Antworten
Wie kann ich es neu laden in Solr wieder? Wenn ich versuche zu starten, den Solr-Admin-UI, bekomme ich die folgende Meldung: Gibt es keine SolrCores läuft. Mit der Solr Admin-Benutzeroberfläche erfordert derzeit mindestens einen SolrCore. InformationsquelleAutor Saqib

Lucene Indizierung in Echtzeit?

Anzahl der Antworten 5 Antworten
Was ist der beste Weg, um zu erreichen, Lucene Indizierung in Echtzeit? Echtzeit-Indizierung was? Könnten Sie erklären, ein wenig mehr, was Sie suchen. Nachdem er in 2 Jahren Arbeit an diesem Projekt ab und an in solr,

hinzufügen von benutzerdefinierten stop-Wörter, die mit lucene in java

Anzahl der Antworten 1 Antworten
Ich bin mit lucene zu entfernen englische Stopp-Wörter, aber meine Anforderung ist, entfernen Sie englische Stopp-Wörter und Benutzerdefinierte Stopp-Wörter. Unten ist mein code zum entfernen englische Stopp-Wörter, die mit lucene. Mein Beispiel-Code: public class Stopwords_remove { public

Warum mit Elasticsearch oder Apache Solr zusammen mit Hibernate Search?

Anzahl der Antworten 4 Antworten
Habe ich gelernt und verstanden, dass Elasticsearch, Apache Solr und Hibernate Search sind auf der Basis der Apache Lucene Bibliothek. Sie bieten schnelle Volltextsuche und alle von Ihnen verwenden entweder JPA-Annotationen, Umsetzung von JPA und/oder definieren Sie

Lucene - Wildcards in Phrasen

Anzahl der Antworten 7 Antworten
Ich bin derzeit versucht, Lucene zum suchen von Daten aufgefüllt, die in einem index. Kann ich das Spiel auf exakte Sätze durch eine einklammerung in eckige Klammern (also "Dokumente Verarbeiten"), kann aber nicht bekommen Lucene zu finden,

Fehler bei der Indizierung mit Apache Solr: mehrere Werte auftreten für non multiValued field-keywords

Anzahl der Antworten 1 Antworten
Ich versuche, die schnell index einer großen Sammlung von html-Dateien für eine einmalige information retrieval experiment mit Apache Lucene Solr. Ich bin mit dem Beispiel Solr-Instanz verteilt mit der neuesten Version ( solr-4.9.0/example/solr ), und in den

Splunk-Datenbank

Anzahl der Antworten 3 Antworten
Ich verstehe, dass Splunk nicht brauchen eine Menge von Funktionen, die eine MySQL-Datenbank anbieten würden, und der index und die Durchführung von Recherchen auf Big Data-es ist vielleicht nicht eine gute option, um die Verwendung einer relationalen

Wie die Suche über mehrere Felder im Lucene-Abfrage mit der Syntax?

Anzahl der Antworten 2 Antworten
Ich bin auf der Suche ein lucene-index und ich Baue Suchanfragen wie field1:"hello" AND field2:"world" aber ich möchte nach einem Wert suchen, in jedem Bereich, sowie die Werte in bestimmte Felder in der gleichen Abfrage, d.h. field1:"hello"

wie, um das setup eine EmbeddedSolrServer Instanz?

Anzahl der Antworten 1 Antworten
Ich bin mit Mühe ein EmbeddedSolrServer zu laufen. Die JavaDoc für CoreContainer ist spärlich, um es gelinde auszudrücken. Ich habe mir die "MergeIndexesEmbeddedTest" und mein code scheint, wie es funktionieren sollte. (Dies ist ein Maven-Projekt) habe ich

Mehrere Abfragen in Solr

Anzahl der Antworten 4 Antworten
Mein problem ist, ich habe n-Felder (sagen wir um die 10) in Solr, die durchsuchbar sind, Sie sind alle indiziert und gespeichert. Ich möchte eine Abfrage ausführen, die ersten auf meiner gesamten index von sagen wir 5000

Lucene term query

Anzahl der Antworten 2 Antworten
In meiner Anwendung haben wir Angebote und jedes Angebot hat eine Zielgruppe, die können über mehrere Felder wie Geschlecht, Alter und Stadt. Für die gender-Teil a deal Ziel sein könnte MALE FEMALE oder BOTH. Ich wollte finden

Gibt es eine schnelle, präzise Highlighter für Lucene?

Anzahl der Antworten 3 Antworten
Habe ich mit der (Java -) Highlighter für Lucene (in der Sandbox-Paket) für einige Zeit. Jedoch ist dies nicht wirklich sehr genau, wenn es um den passenden Begriffe in den Suchergebnissen - es funktioniert gut für einfache

Solr Ergebnis die Gruppierung der Fehler .Unerwartete docvalues Typ SORTED_SET für das Feld 'Lieferant' (expected=SORTIERT)

Anzahl der Antworten 1 Antworten
Ich habe eine solr-schema wie dieses <fields> <field name="id" type="string" indexed="false" stored="true" required="true" /> <field name="product" type="string" indexed="true" stored="true" required="true" /> <field name="vendor" type="string" indexed="true" stored="true" required="true" /> <field name="language" type="string" indexed="true" stored="true" required="true" /> <field name="TotalInvoices"

Was ist der Unterschied zwischen einer phrase, die Abfrage und mit einem Kies-filter?

Anzahl der Antworten 1 Antworten
Ich bin derzeit Indizierung Webseite mit lucene. Das Ziel ist es, in der Lage sein, schnell zu extrahieren, die Seite enthalten, einen bestimmten Ausdruck (in der Regel 1, 2 oder 3 Wörter), und die anderen Wörter (oder

Solr Inkrementelle backup auf ein Echtzeit-system mit heavy-index

Anzahl der Antworten 2 Antworten
Ich umsetzen Suchmaschine mit solr, die den import von minimal 2 Millionen, doc pro Tag. Benutzer müssen können Sie die Suche auf importierte doc so schnell wie möglich (in Echtzeit). Habe ich mit 2 dedizierten Windows x64

Wie zu verwenden TermVector Lucene 4.0

Anzahl der Antworten 3 Antworten
In der indexing-Methode, die ich verwenden Sie die folgende Zeile: Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES); Jedoch in Lucene 4.0 wird dieser Konstruktor ist veraltet und wird new TextField sollte verwendet werden, anstelle von new

immer ähnlichkeits-in Solr

Anzahl der Antworten 2 Antworten
Wie bekomme ich ähnlichkeits zwischen der Abfrage und jedem der abgerufenen Dokumente in Solr? Außerdem, wie kann ich Solr-retrieval-Methode? Zum Beispiel, wählte zwischen Vektor-Raum-Modell oder ein Dokument (Language Model). Ist es möglich? InformationsquelleAutor hasan | 2013-02-21

Wie die Struktur eines index für type ahead für sehr große datasets mit Lucene oder ähnlichen?

Anzahl der Antworten 3 Antworten
Ich habe einen Datensatz von 200million+ Aufzeichnungen und bin auf der Suche um zu bauen ein dediziertes backend macht ein type-ahead-Lösung. Lucene ist von Interesse aufgrund seiner Beliebtheit und Lizenz-Typ, aber ich bin offen für andere open-source-Vorschläge

das Verständnis, wie elasticsearch speichert Datumsangaben intern

Anzahl der Antworten 1 Antworten
Ich würde gerne verstehen, wie ES speichert Datumsangaben intern in Ihre Indizes. Es konvertieren auf UTC? Habe ich ein Feld "t" vom Typ Datum. Hier ist die Zuordnung: "t": { "type" : "date" }, Wenn ich jetzt

Wissen müssen vor-und Nachteile des RAMDirectory

Anzahl der Antworten 3 Antworten
Brauche ich zum verbessern der Leistung von meinem Lucene search-Abfrage. Kann ich RAMDirectory?Macht es die Leistung optimieren?Gibt es eine index-Grenzwert für die Größe dieser? Ich wäre dankbar, wenn jemand könnte die Liste vor-und Nachteile der Verwendung einer

Wie funktioniert Lucene/Solr erreichen hohe performance im multi-Feld / faceted search?

Anzahl der Antworten 2 Antworten
Kontext Dies ist eine Frage, die vor allem über Lucene (oder vielleicht Solr) - Interna. Das Hauptthema ist facettierte Suche, in der die Suche kann passieren, entlang mehrerer voneinander Unabhängiger Dimensionen (Facetten) von Objekten (zum Beispiel Größe,

Wie kann ich überprüfen, Solr-index mit Luke

Anzahl der Antworten 2 Antworten
Wie kann ich überprüfen, meine solr-index mit Luke? Ich versuchte, Sie deutete auf meine index-Speicherort (solr/core1/data/index). Aber ich bin immer der Fehler Unknown format version: -12 welche version von Luke und welche version von Solr verwenden Sie?

Mit Lucene: Warum erhalte ich Zu Viele Klauseln Fehlermeldung, wenn ich eine Präfix-Suche?

Anzahl der Antworten 3 Antworten
Habe ich eine app tun Präfix sucht für eine Weile. Kürzlich die Indexgröße erhöht, und es stellte sich heraus, dass einige Präfixe wurden zu verdammten zahlreiche für lucene zu handhaben. Sie warfen mir eine Zu Viele Klauseln

elasticsearch bulk-Indizierung wird langsamer über die Zeit mit konstanter Anzahl von Indizes und Dokumenten

Anzahl der Antworten 2 Antworten
Erlebe ich, dass bulk-Indizierung Leistung mit Hilfe der .NETTO NEST client und ElasticSearch degradiert im Laufe der Zeit mit einer Konstanten Menge von Indizes und Anzahl der Dokumente. Laufen wir ElasticSearch Version: 0.19.11, JVM: 23.5-b02auf einen m1.große

Lucene Beispiel-Abfrage

Anzahl der Antworten 2 Antworten
Wenn ich Suche nach Satz "ph1 ph2" er findet Texte, die enthält "ph1" oder "ph2". String line = "ph1 ph2"; QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, field, analyzer); Query query = parser.parse(line); Jemand weiß, wie man die Suche

Wie kann ich die delete/update-ein doc mit lucene?

Anzahl der Antworten 2 Antworten
Erstelle ich ein tagging-system für meine Website Bekam ich die Grundlagen des Hinzufügens eines Dokuments in das lucene aber ich kann scheinen, um herauszufinden, wie Sie ein Dokument löschen oder aktualisieren, wenn der Benutzer ändert die tags

Wie wollen Sie index und searchnumbers in Lucene 4.1

Anzahl der Antworten 3 Antworten
In meinem 3.6 code ich das hinzufügen numerisches Feld, um meinen index wie folgt: public void addNumericField(IndexField field, Integer value) { addField(field, NumericUtils.intToPrefixCoded(value)); } aber jetzt müssen Sie es übergeben BytesRef argument, und seine völlig unklar, was

Lucene: Wie index und Suche mehrere Wert unter einzelnen Feld

Anzahl der Antworten 2 Antworten
Zum indizieren und durchsuchen mehrere Wert unter single-Feld. z.B. sagen, ich habe ein Feld Prozessor könnte i3,i5,i7 oder i3 oder i3,i5 Werte. stellen Sie sich nun eine laptop-Daten wie folgt: data1: name= laptop name price = laptop

Solr - _version_ Feld muss vorhanden sein, in der schema-und durchsuchbar sein

Anzahl der Antworten 2 Antworten
Ich bin ziemlich neu in Solr und immer Fehler auf meine erste Beispiel-Kern. Ich bin versucht, das hinzufügen neuer Kern unter admin-dashboard-aber ich bin receving Fehler über version Feld. Gibt es Abhilfe für dieses? Hintergrund: OS: Windows

Wie können Suchergebnisse zwischengespeichert werden?

Anzahl der Antworten 2 Antworten
Wie kann ich die implementieren eine caching-Mechanismus der Suchergebnisse, wie auf stackoverflow? Wie funktioniert elastic search and lucene beschäftigen sich mit caching? InformationsquelleAutor Ann Stor | 2015-01-27

Wie lucene arbeitet mit Neo4j

Anzahl der Antworten 1 Antworten
Ich bin neu Neo4j und Solr/Lucene. ich habe gelesen, dass wir mit lucene-Abfrage in Neo4j, wie hat das funktioniert? Was ist die Verwendung von mit lucene-Abfrage in Neo4j.? Und auch ich brauche einen Vorschlag. Ich muss eine

Halten elasticsearch und die Datenbank synchronisiert

Anzahl der Antworten 2 Antworten
Ich versuche, herauszufinden, einen Weg, um meine mysql-db und elasticsearch-db synchronisiert. Ich habe setup eine jdbc-Fluss über die jprante /elasticsearch-river-jdbc plugin für elasticsearch. Wenn ich führen Sie die nachstehenden Antrag: curl -XPUT 'localhost:9200/_river/my_jdbc_river/_meta' -d '{ "type" :

Mehrere oder einzelne index in Lucene?

Anzahl der Antworten 3 Antworten
Habe ich nach index unterschiedliche Arten von Daten (text, Dokumente, forum, Nachrichten, user-Profil-Daten, etc), die durchsucht werden sollen, zusammen (ie, a single-Suche Ergebnisse zurück, die verschiedenen Arten von Daten). Was sind die Vorteile und Nachteile darin, dass

Suche Namen mit Apache Solr

Anzahl der Antworten 5 Antworten
Ich habe nur gewagt, in den scheinbar einfachen, aber extrem komplexen Welt zu suchen. Für eine Anwendung, die ich bin erforderlich, um das erstellen einer such-Mechanismus für die Suche der Benutzer nach dem Namen. Nach dem Lesen

So suchen Sie Felder mit Platzhalter und Leerzeichen in Hibernate Search

Anzahl der Antworten 2 Antworten
Habe ich ein Suchfeld, führt eine Suche auf den Titel des Felds basierend auf der gegebenen Eingabe, so dass der Benutzer hat empfohlen, alle verfügbaren Titel, beginnend mit dem text eingefügt.Es basiert auf Lucene und Hibernate Suchen.

Mit Solr für die Indizierung und-Suche mit Mongodb und nodejs

Anzahl der Antworten 2 Antworten
Hat jemand irgendwelche Erfahrungen mit diesem stack? Ich arbeite an einem web-Projekt, das schließlich enthalten eine sehr große Menge an Daten und versucht, Sie zu bekommen, Solr schön zu spielen mit einigen einfachen Mongodb-Einträge, aber ich habe

Lucene ' s Algorithmus

Anzahl der Antworten 1 Antworten
Ich lese die Zeitung von Doug Cutting; "Raum-Optimierungen für die Gesamtwertung". Da war es vor langer Zeit geschrieben, Frage ich mich, welche algorithmen lucene verwendet (Bezug auf postings list traversal-und score-Berechnung, ranking). Insbesondere, die gesamten ranking-Algorithmus beschrieben,

Lucene 4.4. Wie man Begriff Frequenz über alle index?

Anzahl der Antworten 1 Antworten
Ich versuche zur Berechnung der tf-idf-Wert der einzelnen Begriffe in einem Dokument. So, ich Durchlaufen, der Begriffe in einem Dokument und finden wollen, die Frequenz des Wortes im gesamten Korpus und die Anzahl der Dokumente, in denen

Elasticsearch verbessern der Abfrageleistung

Anzahl der Antworten 2 Antworten
Ich versuche zum verbessern der Abfrageleistung. Es dauert durchschnittlich etwa 3 Sekunden für einfache Abfragen, die nicht einmal berühren einer verschachtelten Dokument, und es ist manchmal mehr. curl "http://searchbox:9200/global/user/_search?n=0&sort=influence:asc&q=user.name:Bill%20Smith" Sogar ohne die Art dauert es Sekunden. Hier

Solr Stoppwörter Magie

Anzahl der Antworten 1 Antworten
Meine Stoppwörter nicht wie erwartet funktioniert. Hier ist ein Teil von meinem schema: <fieldType name="text_general" class="solr.TextField"> <analyzer type="index"> <tokenizer class="solr.KeywordTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/> <filter class="solr.LowerCaseFilterFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="solr.KeywordTokenizerFactory"/> <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>

Solr: Was sind die Vorteile der Länge Normalisierung/omitNorms=false?

Anzahl der Antworten 1 Antworten
Sind wir mit Solr für die Suche von Artikeln in verschiedenen Längen. Wir der index sowohl beschreibende Metadaten (Titel, Autor, Kategorie, Stichwörter, etc) und den kompletten Artikel-text. Wir tun nicht steigern Relevanz zum Zeitpunkt der index -