Wie zu verwenden CMU Sphinx 4 for speech to text mit englischen voxforge-Modelle

Ich versuche, herauszufinden, wie zu verwenden sphinx4 oder pocketsphinx mit der englischen voxforge Modell, aber ich kann Sie nicht arbeiten. Ich habe versucht zu Lesen, doc-Seiten (wie diese http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html ), aber es hilft mir nicht.

Was ich will ist eine ausführbare Datei, wo kann ich angeben, welches Modell zu verwenden und die audio-Datei als Quelle und die ausführbare Datei ausdrucken, am besten ist es, zu raten, was die Stimme auf der Aufnahme sagt.

Ich hade einige Glück mit:
pocketsphinx_continuous -infile Aufnahme.wav-2> /dev/null

Aber es bricht ab, bevor die komplette audio-Datei wird transkribiert und das Standard-Modell hat waay zu paar Worte zum erstellen eines lesbaren text, der von der audio.

Habe ich kompiliert und getestet, die demos in sphinx4-source-Paket, aber alle Beispiele scheinen zu paar Worte und muss ein Modell loke die voxforge man mich nützlich.

Wie kann ich diese einrichten?

Ich habe in der Lage zu ändern Sphinx zu transkribieren mit dem Voxforge-Modelle. Die schlechte Nachricht ist, dass auch bei Voxforge, der Sphinx Genauigkeit ist peinlich schlecht. Ich würde nicht verschwenden Ihre Zeit mit der Sphinx. Es ist nicht verwendbar bei allen.
was empfehlen Sie als alternative?
Ich bin auch interessiert an alternativen. Könnten Sie uns alles besser? Vorzuziehen kostenlos?
Der Autor des Blogs grasch.net/node/21 verwendet Sphinx mit Voxforge man auf 27,9% word error rate,, von 13,3%, nach Anpassung an seine Stimme. Das ist ziemlich gut für eine große Sprache-Modell, und er verwendet es für die Transkription text erfolgreich (in einem späteren blog-post sein)

InformationsquelleAutor tirithen | 2011-12-31

Schreibe einen Kommentar