Wie zu verwenden CMU Sphinx 4 for speech to text mit englischen voxforge-Modelle

Ich versuche, herauszufinden, wie zu verwenden sphinx4 oder pocketsphinx mit der englischen voxforge Modell, aber ich kann Sie nicht arbeiten. Ich habe versucht zu Lesen, doc-Seiten (wie diese http://cmusphinx.sourceforge.net/sphinx4/doc/UsingSphinxTrainModels.html ), aber es hilft mir nicht.

Was ich will ist eine ausführbare Datei, wo kann ich angeben, welches Modell zu verwenden und die audio-Datei als Quelle und die ausführbare Datei ausdrucken, am besten ist es, zu raten, was die Stimme auf der Aufnahme sagt.

Ich hade einige Glück mit:
pocketsphinx_continuous -infile Aufnahme.wav-2> /dev/null

Aber es bricht ab, bevor die komplette audio-Datei wird transkribiert und das Standard-Modell hat waay zu paar Worte zum erstellen eines lesbaren text, der von der audio.

Habe ich kompiliert und getestet, die demos in sphinx4-source-Paket, aber alle Beispiele scheinen zu paar Worte und muss ein Modell loke die voxforge man mich nützlich.

Wie kann ich diese einrichten?

Ich habe in der Lage zu ändern Sphinx zu transkribieren mit dem Voxforge-Modelle. Die schlechte Nachricht ist, dass auch bei Voxforge, der Sphinx Genauigkeit ist peinlich schlecht. Ich würde nicht verschwenden Ihre Zeit mit der Sphinx. Es ist nicht verwendbar bei allen.
was empfehlen Sie als alternative?
Ich bin auch interessiert an alternativen. Könnten Sie uns alles besser? Vorzuziehen kostenlos?
Der Autor des Blogs grasch.net/node/21 verwendet Sphinx mit Voxforge man auf 27,9% word error rate,, von 13,3%, nach Anpassung an seine Stimme. Das ist ziemlich gut für eine große Sprache-Modell, und er verwendet es für die Transkription text erfolgreich (in einem späteren blog-post sein)

InformationsquelleAutor tirithen | 2011-12-31

10

Es ist sehr einfach, Stecker in Voxforge akustischen Modell. Das wichtigste Dokument deckt die API ist cmusphinx tutorial:

http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4

Ist es empfehlenswert, es zu Lesen, bevor Sie beginnen. Bitte beachten Sie auch, dass es empfohlen ist die Verwendung von En_US Englisch Generisches akustisches Modell, es ist genauer als Voxforge.

Schritt für Schritt müssen Sie Folgendes tun:
- Download voxforge Modell von sourceforge herunter und entpacken Sie es in einen Ordner
- Kasse sphinx4 von github und bauen mit gradle
- Laufen TranscriberDemo
- Gehen sphinx4-Proben/src/main/java/edu/cmu/sphinx/demo/transcriber-Ordner, öffnen Sie Transcriber demo und Bearbeiten das akustische Modell Weg als unten.
- Bearbeiten den Speicherort der audio-Datei in den Quellen benötigen Sie eine andere audio-Datei
- Ausführen demo wieder und genießen
Wäre es
```
   //Load model from the folder in your project
   configuration.setAcousticModelPath("file:voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000");
```
sehr nette Antwort... ich habe auch ähnliche problem habe ich auch heruntergeladen voxforge-en-0.3 von SourceForge, etc-Ordner hat so viele Gläser, die ich gerade kann nicht herausfinden, welchen Weg soll gegeben werden... bitte um Hilfe und besuchen Sie stackoverflow.com/questions/8727389/...
Ich bin mir nicht sicher, was Sie reden. Die Gläser etc? Es gibt keine Gläser überhaupt. Für diese Frage hast du nicht deutlich angegeben werden, das problem zu lösen, keine Ahnung was für Problem hast du da.
Ich folgte Ihre Antwort und heruntergeladen VoxForge von sourceforge, Allerdings konnte ich nicht so konfigurieren, dass es verwendet werden, mit Sphinx4. Sie sagte <property name="location" value="file:voxforge_model_folder_name"/> Jedoch, dass nicht Arbeit für mich. So stöberte ich den VoxForge-Ordner, aber habe versucht, verschiedene Kombinationen... aber nichts funktioniert so weit... plz Help!! bitte sehen Sie die bearbeitete Antwort....
Akustisches Modell der Ordner ist voxforge-en-0.4/model_parameters/voxforge_en_sphinx.cd_cont_5000
vielen Dank an Euch!!! plz siehe meine editierte Frage auf stackoverflow.com/questions/8727389/...

InformationsquelleAutor Nikolay Shmyrev

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.