Computer-KI-Algorithmus, um Sätze schreiben?
Ich bin auf der Suche nach Informationen über algorithmen für die Verarbeitung von text Sätze oder Folgen einer Struktur, wenn Sie Sätze bilden, die gültig sind, in eine normale menschliche Sprache, wie z.B. Englisch. Ich würde gerne wissen, ob es Projekte in diesem Bereich zu arbeiten, dass ich gehen kann, erfahren Sie aus oder starten Sie mit.
Zum Beispiel, wenn ich gab ein Programm ein Substantiv, sofern es mit einem thesaurus (Verwandte Wörter) und part-of-speech (so wird es verstanden, in denen jedes Wort gehörte in einem Satz) - könnte es eine zufällige, gültige Satz?
Ich bin sicher, es gibt viele Unterabschnitte dieser Art von Forschung, so führt in diesem wäre toll.
InformationsquelleAutor Xeoncross | 2011-04-08
Du musst angemeldet sein, um einen Kommentar abzugeben.
Dem Feld, das Sie suchen, heißt natural language generation, ein Teilbereich der Verarbeitung natürlicher Sprache
http://en.wikipedia.org/wiki/Natural_language_processing
Satz generation ist entweder sehr leicht oder sehr schwer, je nachdem wie gut Sie möchten, dass die Sätze zu werden. Derzeit gibt es keine Programme, die in der Lage zu generieren, 100% sinnvolle Sätze zu bestimmten Substantiven (sogar mit einem thesaurus) -- wenn es das ist was du meinst.
Wenn auf der anderen Seite, würden Sie zufrieden sein mit dem Quatsch, dass war manchmal ungrammatisch, dann können Sie versuchen, ein n-Gramm-basierten Satz-generator. Diese einfach miteinander verketten von Wörtern, die dazu neigen, zu erscheinen in der Reihenfolge, und 3-4-Gramm-Generatoren schauen Sie ganz okay, manchmal (obwohl Sie erkennen Sie als das, was erzeugt eine Menge von spam-E-Mail).
Hier ist eine Einführung in die Grundlagen der n-Gramm-basierte Generierung, mit NLTK:
http://www.nltk.org/book/ch02.html#generating-random-text-with-bigrams
InformationsquelleAutor silverasm
Dies wird als NLG (Natural Language Generation), obwohl das ist hauptsächlich die Aufgabe der Generierung von text, der beschreibt, die einen Satz von Daten. Es gibt auch eine Menge Forschung auf völlig zufälligen Satz-generation.
Einen Ansatzpunkt ist die Verwendung von Markov-Ketten zu generieren Sätzen. Wie dies geschieht, ist, dass Sie eine übergangs-matrix, die sagt, wie wahrscheinlich es ist, um den übergang zwischen jeder jedes Teil-of-speech. Sie haben auch die wahrscheinlichste Start-und End-part-of-speech eines Satzes. Setzen Sie diese alle zusammen und generieren Sie wahrscheinlich Sequenzen von parts-of-speech.
Nun, Sie sind noch lange nicht fertig, wird dies zunächst nicht bieten ein sehr gutes Ergebnis, da Sie nur unter Berücksichtigung der Wahrscheinlichkeit zwischen benachbarten Wörtern (auch als bi-Gramm), also, was Sie tun möchten, ist zu erweitern, diese zu suchen, zum Beispiel am übergang matrix zwischen drei Teile-of-speech - (das macht eine 3D-matrix und gibt Sie Trigramme). Sie können erweitern es mit 4 Gramm, in 5 Gramm, etc. je nach Rechenleistung und wenn Ihr corpus füllen können solche matrix.
Schließlich müssen Sie zu Flicken, Dinge wie Objekt-Vereinbarung (Subjekt-verb-Vereinbarung, Adjektiv-verb-Vereinbarung (nicht in Englisch allerdings), etc.) und angespannt, so, dass alles deckungsgleich ist.
InformationsquelleAutor Gustav Larsson
Ja. Es gibt einige arbeiten, den Umgang mit der Lösung von Problemen in NLG mit KI-Techniken. Soweit ich weiß, gibt es derzeit keine Methode, die Sie verwenden können, für jeden praktischen nutzen.
Wenn Sie den hintergrund, schlage ich immer vertraut mit der Arbeit von Alexander Koller von der Universität des Saarlandes. Er beschreibt, wie code NLG zu PDDL. Die wichtigsten Artikel werden Sie Lesen möchten, ist "Satz generieren als Planungs-problem".
Wenn Sie haben keinen hintergrund in NLP, suchen Sie einfach die online-Kurse oder Kursmaterialien von Michael Collings oder Dan Jurafsky.
InformationsquelleAutor Oded
Schreiben zufällige Sätze bilden, ist nicht schwer. Jeder parser lehrbuch ist einfach-Englisch-Grammatik-Beispiel ausgeführt werden kann, im Rückwärtsgang zu erzeugen, grammatikalisch korrekten Nonsens-Sätze.
Andere Möglichkeit ist das Wort-Tupel-random-walk, populär gemacht durch die alten BYTE-Magazin TRAVESTIE, oder Sachen wie
http://www.perlmonks.org/index.pl?node_id=94856
InformationsquelleAutor fche