Wie kann ich ein waveform-Bild einer MP3 in Linux?
Gegeben MP3 würde ich gerne extrahieren Sie die Wellenform aus der Datei in ein Bild (.png)
Gibt es ein Paket, das tun kann, was ich brauche ?
- Ja, es ist ein tool, das genau das leistet: tuned-project.org/audio-tools
- abgestimmt audio-tools link ist tot, es scheint zu sein launchpad.net/tuned-audio-tools/+download (Hinweis, Sie müssten
libgee
undgstreamer-1.0
zu bauen); siehe auch github.com/limikael/rendersound (Hinweis: Sie benötigen eine relativ neuelibavcodec
um es zu bauen); siehe auch wav2png
Du musst angemeldet sein, um einen Kommentar abzugeben.
Mit
sox
undgnuplot
können Sie erstellen, die grundlegende Wellenform Bilder:Etwas zu schaffen, das einfacher/schöner, verwenden Sie die folgende GNU Plot-Datei als Vorlage (speichern Sie es als audio.gpi):
- und ausgeführt werden:
Basierend auf diese Antwort zu einer ähnlichen Frage, die eher generell in Bezug auf Datei-format, aber weniger allgemein in Bezug auf die software verwendet.
Wenn Sie eine GUI-Umgebung können Sie die audacity audio-editor laden Sie die mp3, und verwenden Sie dann den Befehl "drucken" erzeugen Sie ein pdf der Wellenform. Dann konvertieren Sie das pdf in png.
Ich würde so etwas tun :
finden Sie ein Werkzeug zum konvertieren von mp3 zu PCM, dh Binär-Daten mit einer 8-oder 16-bit-Wert
pro Probe. Ich vermute in mplayer erreichen kann, dass
Rohr das Ergebnis einer utility konvertieren von Binärdaten in eine ascii -
Darstellung der zahlen im dezimal-format
verwenden gnuplot zur Transformation dieser Liste der Wert in eine png-Grafik.
- Und voilà, die macht der Rohrleitungen zwischen unix-tools. Nun Schritt 2 in dieser Liste werden könnte optionnal wenn gnuplot in der Lage ist, es zu Lesen die Daten aus einem binären format.
Dies ist eine standard-Funktion in SoX (command-line-tool für sound, Windows & Linux)
Überprüfen Sie die "Spektrogramm" - Funktion auf http://sox.sourceforge.net/sox.html
"Spektrogramm wiedergegeben wird, eine Portable Network Graphic (PNG) - Datei, und zeigt die Uhrzeit in der X-Achse, Frequenz auf der Y-Achse, und audio-signal Größe in der Z-Achse. Z-Achsen-Werte sind dargestellt durch die Farbe (oder wahlweise die Intensität) der Pixel in der X-Y-Ebene. Wenn das audio-signal enthält mehrere Kanäle, diese sind dann von oben nach unten, beginnend von Kanal 1 (das ist der linke Kanal für stereo-audio)."
Möchten Sie vielleicht zu prüfen, audiowaveform von der BBC.
https://github.com/bbcrd/audiowaveform