Python-Frequenz-Erkennung

Ok, was ich versuche zu tun, ist eine Art von audio-Bearbeitung-software kann erkennen, dass eine Häufigkeitsverteilung ein, wenn die Frequenz gespielt wird lange genug (ein paar ms) ich weiß, ich habe eine positive übereinstimmung. ich weiß, ich würde verwenden müssen, FFT oder etwas simiral aber auch in diesem Feld der Mathematik, ich bin Scheiße, ich habe das internet durchsucht, konnte aber nicht finden, ein code, der tun konnte, nur diese.

dem Ziel, im Versuch, accieve ist, um mir ein eigenes Protokoll zum senden von Daten Trog sound, sehr niedriger bitrate pro Sekunde (5-10bps), aber ich bin auch sehr begrenzt auf die übertragungsreichweite Ende, so dass der Empfang der software müssen in der Lage sein, benutzerdefinierte (nicht verwenden eine tatsächliche hardware - /software-modem) auch möchte ich, dass dies nur software (keine zusätzliche hardware, außer der Soundkarte)

vielen Dank für die Hilfe.

Dies kann hilfreich sein (achten Sie darauf, Lesen Sie die Antworten): keyongtech.com/5003865-frequency-analysis-without-numpy

InformationsquelleAutor MatijaG | 2010-04-15

41

Den aubio Bibliotheken wurden eingewickelt mit SWIG und kann somit verwendet werden, die von Python. Unter Ihren vielen Funktionen gehören mehrere Methoden für die Erkennung/Schätzung einschließlich der YIN Algorithmus und einige harmonische Kamm algorithmen.

Jedoch, wenn Sie wollen etwas einfacher, ich schrieb einige code für die pitch-Schätzung vor einiger Zeit, und Sie können nimm es oder lass es. Es wird nicht so genau sein, wie mithilfe von algorithmen, die in aubio, aber es könnte gut sein, genug für Ihre Bedürfnisse. Ich im Grunde nahm einfach die FFT-Analyse der Daten mal ein Fenster (ein Blackman-Fenster in diesem Fall) zum Quadrat der FFT-Werte, gefunden die bin, die hatte den höchsten Wert, und verwendet eine quadratische interpolation rund um den Gipfel über den log des max-Wertes und die beiden benachbarten Werte zu finden, die Grundfrequenz. Die quadratische interpolation ich nahm etwas Papier, das ich gefunden habe.

Es funktioniert ziemlich gut auf die test-Töne, aber es wird nicht so robust oder so genau wie die anderen oben genannten Methoden. Die Genauigkeit kann erhöht werden durch die Erhöhung der chunk-Größe (oder reduziert durch die Senkung der it). Die chunk-size sollte ein Vielfaches von 2, um die volle Nutzung der FFT. Auch, ich bin nur der Bestimmung der fundamentalen Tonhöhe für jedes chunk mit keine überschneidung. Ich verwendet PyAudio zu spielen, den Ton über beim schreiben der geschätzten Steigung.

Source Code:
```
# Read in a WAV and find the freq's
import pyaudio
import wave
import numpy as np

chunk = 2048

# open up a wave
wf = wave.open('test-tones/440hz.wav', 'rb')
swidth = wf.getsampwidth()
RATE = wf.getframerate()
# use a Blackman window
window = np.blackman(chunk)
# open stream
p = pyaudio.PyAudio()
stream = p.open(format =
                p.get_format_from_width(wf.getsampwidth()),
                channels = wf.getnchannels(),
                rate = RATE,
                output = True)

# read some data
data = wf.readframes(chunk)
# play stream and find the frequency of each chunk
while len(data) == chunk*swidth:
    # write data out to the audio stream
    stream.write(data)
    # unpack the data and times by the hamming window
    indata = np.array(wave.struct.unpack("%dh"%(len(data)/swidth),\
                                         data))*window
    # Take the fft and square each value
    fftData=abs(np.fft.rfft(indata))**2
    # find the maximum
    which = fftData[1:].argmax() + 1
    # use quadratic interpolation around the max
    if which != len(fftData)-1:
        y0,y1,y2 = np.log(fftData[which-1:which+2:])
        x1 = (y2 - y0) * .5 / (2 * y1 - y2 - y0)
        # find the frequency and output it
        thefreq = (which+x1)*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    else:
        thefreq = which*RATE/chunk
        print "The freq is %f Hz." % (thefreq)
    # read some more data
    data = wf.readframes(chunk)
if data:
    stream.write(data)
stream.close()
p.terminate()
```
- wow Super danke, das sieht wie tun jetzt habe ich nur gota Figur, wie zu Lesen, die audio in Echtzeit von auido-Eingang (Mikrofon)
- Gehen die PyAudio site people.csail.mit.edu/hubert/pyaudio und scrollen Sie runter zu den Beispielen. Sie werden sehen, dass einige, die Eingabe aus dem Mikrofon.
- uhm kann u mir helfen, Figur, warum ist dieser Fehler passiert: "müssen mehr als 0-Werte packen" auf die folgende Zeile "y0,y1,y2 = np.log(fftData[die-1:die+2:])"
- Ja, das war irgendwie buggy dort. Ich habe es behoben. Das problem war, dass wenn die war = 0, oder der Letzte Wert des fftData, dann würde es nicht wieder 3 Werte gibt. Wir wollen nicht den Wert in der 0 bin fftData sowieso (es ist der DC-offset).
- Wäre es möglich, np.fft.fftfreq, um die Frequenzen, anstatt zu tun, die Konvertierung und interpolation selbst?
- rees, sieht es nicht aus, np.fft.fftfreq tut, was wir wollen.
- Ich möchte so vergleichen Sie zwei audios, können Sie mir bitte helfen?
- Jemand wissen, wie man die Grundfrequenz des Mikrofon-audio-Eingang?
InformationsquelleAutor Justin Peel
6

Wenn du gehst zu verwenden FSK (frequency-shift-keying) für die Codierung von Daten, sind Sie wahrscheinlich besser dran mit dem Goertzel-Algorithmus so können Sie überprüfen nur die Frequenzen, die Sie wollen, statt einer vollständigen DFT/FFT.

InformationsquelleAutor Guilherme
1

Finden Sie das Frequenzspektrum des sliding windows über den Klang aus hier und dann überprüfen Sie das Vorhandensein der vorherrschenden Frequenz-band über das finden der Fläche unter dem Frequenzspektrum Kurve für diesen band aus hier.

InformationsquelleAutor Hapalop
0

Während ich habe nicht versucht, audio-Verarbeitung mit Python vor, vielleicht könntest du etwas bauen, basierend auf SciPy (oder dessen Teilprojekt NumPy), ein framework für die effiziente wissenschaftliche/engineering numerische Berechnung? Sie beginnen mit der Suche an scipy.fftpack für Ihre FFT.
- ok, ich fand das swharden.com/blog/... tho jetzt Frage ich mich, wie finde ich die freq-Bereich am höchsten (auch die SciPy ein bisschen geholfen danke
- so haben Sie herausfinden, wie Sie dies tun?
InformationsquelleAutor Karmastan

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.