Die Natürliche Sprache, Datum und Uhrzeit-parser für java
Arbeite ich an einer Natural Language parser, der prüft, einen englischen Satz und extrahiert Informationen, wie name, Datum etc.
zum Beispiel: "Lets treffen nächsten Dienstag um 5 Uhr am Strand."
So ist die Ausgabe etwas wie : "Lets treffen 15/09/2009 bei 1700 hr am Strand"
Also im Grunde, was ich wissen will ist, dass gibt es irgendein framework oder eine Bibliothek für JAVA zu tun, diese Art von Operationen-etwa bei der Analyse von Daten aus einem Satz und geben Sie eine Ausgabe mit einigen festgelegten format.
Grüße,
Pranav
Danke für die Antworten. Ich habe mir auf einige NLPs wie LingPipe, OpenPL, Stanford NLP. Ich wollte mal Fragen, tun Sie hav etwas für Datum-Analyse für java.
- bump! Ich habe auch dieses problem und die vorgeschlagenen Lösungen scheinen nicht zu beantworten
- FYI, später ein Duplikat dieser Frage, Generic Date-Parsing-Bibliothek aus dem unstrukturierten text
Du musst angemeldet sein, um einen Kommentar abzugeben.
Natty ist ein wirklich guter Ersatz für JChronic.
2 wednesdays from now
können nicht analysiert werden, indem jede andere Lösung, die ich gefunden habe. +115/12/2004
. Es betrachtet es alstoday 15th hour
.Können Sie JChronic, der Java-port von Chronische.
Haben Sie versucht,jchronic? Ich bezweifle jedoch, jede Bibliothek kann direkt die Arbeit mit den Sätzen: Sie hätten zu extrahieren, Satzfragmente und füttern Sie zu einem NLP-Datum-Analyse-framework selbst, vielleicht auf die trial-n-error " - basis (größere und größere Fragmente bis auf den Rahmen wirft einen Fehler).
Ich glaube nicht, dass es keinen Rahmen gibt, macht das out of the box. Was Sie tun können, ist, erstellen Sie einen Satz von regulären Ausdrücken zum vergleichen, diese Muster.
Ich würde vorschlagen, mit UIMA mit OpenNLP Anschlüsse und derselben hand gemacht regexp-Regeln.
Schrieb ich eine NLP-Skript im Python-NLTK gefüttert und die Ergebnisse zu Ruby ' s chronische.
Für meinen Anwendungsfall, ich hatte mehr Glück mit chrono-java - leider sieht es veraltet und in keinem Maven-repository (auch nicht über https://jitpack.io/ seit der build ist kaputt), so dass Sie zu reparieren und bauen es für sich selbst.
Allerdings, Check-out den code und Festsetzung einer Abhängigkeit (
maven-javadoc-plugin
fehlte groupId und ich aktualisiert die version), die mir erlaubt, zu bauen und führen Sie ein einfaches Beispiel erfolgreich:ergab 2 Datumsangaben extrahieren: