extrahieren von pitch-Funktionen aus der audio-Datei

Ich versuche zum extrahieren von pitch-Funktionen von einer audio-Datei, die ich verwenden würde, für eine Klassifizierung problem. Ich bin mit python(scipy/numpy) für die Einstufung.

Ich denke, ich kann die Frequenz Funktionen mit scipy.fft aber ich weiß nicht, wie zu approximieren, werden die Noten mit Frequenzen. Ich habe etwas recherchiert und gefunden, dass ich brauche, um die chroma-Merkmale, die Zuordnung von Frequenzen zu 12 Behälter für Noten einer chromatischen Tonleiter.

Ich denke, es ist ein chroma-toolbox für matlab, aber ich glaube nicht, dass es etwas ähnliches für python.

Wie soll ich vorwärts gehen mit diesem?
Könnte jemand auch vorschlagen, das Lesen material, das ich in Aussehen sollte?

InformationsquelleAutor Ada Xu | 2013-12-22
Schreibe einen Kommentar