Open-source-code für die voice-Erkennung und Diskriminierung

Habe ich 15 audio-Kassetten, von denen ich glaube, enthält eine alte Aufnahme von meiner Großmutter und mir zu reden. Einen schnellen Versuch die richtige Stelle zu finden nicht turn it up. Ich will nicht zu hören Sie bis zu 20 Stunden des Bandes, um es zu finden. Die Lage kann nicht am start sein, der eines der Bänder. Die meisten Inhalte haben scheint, fallen in drei Kategorien-in der Reihenfolge der Gesamt-Länge, längste zuerst: silence, speech radio und Musik.

Ich planen, zu konvertieren alle Bänder in ein digitales format, und dann suchen Sie wieder für die Aufnahme. Der offensichtliche Weg ist, Sie alle zu spielen im hintergrund, während ich andere Dinge zu tun. Das ist viel zu einfach für mich, also: gibt es irgendwelche open-source-Bibliotheken oder anderen code, der erlauben würde, mich zu finden, in der Reihenfolge der zunehmenden Komplexität und Nützlichkeit:

  1. Nicht-silent-Regionen
  2. Regionen, in denen die menschliche Rede
  3. Regionen mit meine eigene Rede (und meiner Großmutter)

Meine Vorliebe für Python, Java oder C.

Fehlerhaften Antworten, Tipps über Suchbegriffe wären dankbar, da ich nichts weiß über das Feld.

Verstehe ich, ich könnte leicht zu verbringen mehr als 20 Stunden auf.

InformationsquelleAutor der Frage Croad Langshan | 2011-04-22

Schreibe einen Kommentar