wav-to-midi-Konvertierung

Ich bin neu auf diesem Gebiet, aber ich ausführen muss, um eine WAV-to-MIDI-Konvertierung in java.
Gibt es eine Möglichkeit zu wissen, was genau sind die Schritte zum WAV-to-MIDI-conversion?
Ich habe eine sehr grobe Vorstellung, wie müssen Sie;
probieren Sie die wav-Datei, filtern, verwenden Sie die FFT für Spektralanalyse, feature-Extraktion und schreiben Sie dann den extrahierten Merkmalen auf MIDI.
Aber ich finde keine soliden Quellen oder Papiere so wie alle das tun?
Kann jemand geben Sie mir Hinweise, wie und wo Sie anfangen sollen?
Gibt es irgendwelche Open-Source-APIs zur Verfügung, die für diese WAV-to-MIDI-conversion-Prozess?

Voraus vielen Dank

Diese Prüfung als gut stackoverflow.com/questions/1628071/...
mögliche Duplikate von wav zur midi-Konvertierung

InformationsquelleAutor Dolphin | 2010-01-24

27

Es ist ein etwas beteiligten Prozess, als Sie sich vorstellen können.

Diesem problem der Forschung wird oft als Musik Transkription: der Akt der Konvertierung eines low-level-Darstellung von Musik (z.B. Wellenform) in ein higher-level-Darstellung wie MIDI oder auch Noten.

Die Raffinesse von Ihrer Lösung hängt von der Komplexität der Eingabedaten. Tonnen von Forschungsarbeiten Adresse Musik-Transkription nur auf monophone Klavier oder Schlagzeug... denn Sie sind einfach zu transkribieren. (Relativ.) Violine härter ist. Stimme ist sogar noch schwerer. Violine plus Stimme plus Klavier ist viel schwieriger. Eine Symphonie ist fast unmöglich. Sie erhalten das Bild.

Die grundlegenden Elemente der Musik-Transkription mit der folgenden, sich überlappenden Bereichen:
1. (multi)pitch-Schätzung
2. instrument der Anerkennung, der klangliche Modellierung
3. Rhythmus-Erkennung
4. Hinweis onset/offset detection
5. form/Struktur-Modellierung
Suche für die Papiere auf "Musik-Transkription" auf Google Scholar oder aus dem ISMIR-Verfahren: http://www.ismir.net. Wenn Sie mehr Interesse an eine der oben genannten Unterthemen, ich kann dir weiter. Viel Glück.

EDIT: Dass gesagt wird, es gibt vorhandene Lösungen, können wir alle auf dem web finden. Fühlen Sie sich frei, Sie zu versuchen. Aber wie Sie das tun, bewerten diese mit einem kritischen Auge und Ohr. Welche Arten von audio-Signalen verursachen würde Transkription zu scheitern?

EDIT 2: Ah, Sie sind nur dabei für Klavier. Okay, das ist machbar. Musik-Transkription bis zu dem Punkt vorangekommen, wo es die Transkription monophoner Klavier, ziemlich gut. Ein Rachmaninov-Konzert immer noch Probleme aufwerfen.

Unsere Empfehlungen hängen von Ihrem Ziel. Sie Stand "müssen zu erfüllen... in Java." So klingt es wie Sie nur wollen, etwas zu arbeiten, unabhängig davon, wie bekommt Sie es. In diesem Fall Stimme ich zu 100% mit anderen: verwenden Sie etwas, das existiert.

Das ist tatsächlich eine interessante Frage; alle von MIR-Bibliotheken, die ich kenne, sind in der Regel C/C++/Python/Matlab. Aber nicht Java. Die EchoNest hat eine Java-API, aber ich glaube nicht, dass es nicht beachten-level-Transkription. http://developer.echonest.com. (Edit: Es hat Hinweis-level-Transkription. Die zurückgegebenen Daten umfassen Tonhöhe, Klangfarbe, beat, tatum und mehr. Aber ich finde die Polyphonie ist immer noch ein problem.)

Oh, Marsyas ist Java-basiert. Cool. Ich dachte, es war nur C++. http://marsyas.info/ Ich dieses empfehlen. Es ist entwickelt von George Tzanetakis, ein professor in MIR. Es bedeutet signal-level-Analyse und soll eine gute option sein.

Nun, wenn dies für eine unterhaltsame Lernerfahrung, ich denke, Sie können mit der sound-manipulation utilities in Java zu Experimentieren mit WAV-signal und sehen, was rauskommt.

EDIT: Diese Seite beschreibt MIR die software besser als ich es kann: Die Werkzeuge, Die Wir Verwenden

Für Matlab, die Sie interessieren können, der in der MIR Toolbox

Hier ist eine schöne Seite des gemeinsamen Datensätzen: MIR Datasets
- Vielen Dank für die Tipps, Steve. Ich bin der Planung auf die wav-to-midi-nur für piano-performance. Ich dachte, Musik-Transkription ist nur die Generierung einer digitalen Musik-danke für die Korrektur mich. Ich brauche einen Rekord Klavier spielen eines Musik-Stückes und erzeugen Sie eine midi-Datei heraus (ich.e.schreiben Sie die midi-Datei von wav-Datei),erfassen die meisten der musikalischen features von Tonhöhe, Dynamik, timing, Rhythmus, Formulierungen, Ton, Artikulation etc für die Bearbeitung verwendet werden. Die Erfassung dieser direkt von midi ist möglich, aber von wav-ich kann mir nicht denken, von wo aus zu starten. Ich werde die Forschung auf die Bereiche, die Sie sagte zuerst - danke Steve
- Muss ich Matlab für diesen Prozess und die Integration mit sagen Java? Voraus danke Steve. Sie wirklich bemalt, das größere Bild.
- Sie sind herzlich willkommen. Siehe meine Antwort auf Kommentare im original-Beitrag.
- Steve, vielen Dank für Eure Antworten. Ich würde gerne mehr erfahren und dieses Feld zu erforschen. Sie haben erwähnt, dass "alle von MIR-Bibliotheken, die ich kenne ...". Ich bin nicht gebunden an irgendeine spezifische Sprache. Können Sie empfehlen eine Bibliothek (möglichst open-source, aber nicht notwendig) - jede Sprache? Ich bin besonders daran interessiert, ein einzelnes instrument Transkription. Auch, der aktuelle Stand der Technik ermöglicht "Echtzeit" - Transkription? d.h. ein normaler PC kann-Transkript der Musik, wie Sie gespielt wird?
- Sie sind herzlich willkommen. Echtzeit-Transkription auf einem Durchschnitts-PC ist ziemlich schlecht, nehme ich an. Weder ich noch viele andere stört es, weil wir haben ein hart genug Zeit bekommen, offline Transkription perfektioniert! Es ist selten, dass eine Transkription rate von besser als, sagen wir, 80% (der Noten). Finden Sie unter Bearbeiten weitere tools.
InformationsquelleAutor Steve Tjoa
4

Dies ist ein sehr großes Unternehmen für sein neu auf dem Gebiet, es sei denn, du meinst Sie sind vertraut mit den signal-Analyse und die Erkennung von Auffälligkeiten im Allgemeinen und wollen schauen, insbesondere in die automatische Transkription.

Gibt es keine API für WAV zur MIDI-Konvertierung. Vamp ist ein framework für die Merkmalsextraktion mit plugins, aber zu tun, automatische Transkription, die Sie brauchen würde, um alle Funktionalität der vorhandenen plugins, plus Implementierung von Funktionen, die es in keiner von Ihnen noch.

Blättern Sie durch die Beschreibungen der plugins, die auf der vamp-download-Seite, alle Beschreibungen Sie nicht verstehen, sind Themen, sollten Sie beginnen, zu recherchieren ob Sie dies tun wollen.
- Vielen Dank für die Anregungen Smith. Wenigstens weiß ich jetzt, dass es keinen Punkt auf der Suche nach APIs, die das tut. Können Sie plugins mit java-code? Feature-Extraktion - muss ich verwenden algorithmen? Nur weil ich weiß, dass ein Algorithmus, wie kann ich put it down, um code? Muss ich Matlab und Integration mit einer Sprache (z.B. Java)? Können Sie mir bitte ein Bild? Nochmals vielen Dank Smith
- Vamp verwendet C, C++. Gibt es keine Java-plugins und solche Ressourcen? Das wäre am nützlichsten. Wie können Sie plugins in java-code? Voraus vielen Dank
- Java wird nicht gesehen, so Häufig in der signal-Verarbeitung / - Analyse, denn es ist relativ CPU-intensiv sind, und bis vor kurzem hardware war nicht schnell genug, das zu tun diese Art der Sache die in Java mit akzeptablen Geschwindigkeiten. Es sieht aus wie Steve einziehen führen allerdings. Für ein höheres level-Ansatz gibt es auch die Möglichkeit der Verwendung einer Umgebung wie csound csounds.com bietet eine große Anzahl von tools für die Synthese und Analyse von sound mit weniger sorgen über die explizite Zuweisung von Speicher und befreit, als würden Sie mit C.
- Über, wie man plugins in Java ein plugin ist eine dynamisch geladene Bibliothek, die Sie verwenden können, JNI zu laden und in einem Java-Programm: en.wikipedia.org/wiki/Java_Native_Interface
InformationsquelleAutor Justin Smith
3

Wenn Sie nicht brauchen, um die Aufgabe zu automatisieren (dh für eine website, wo Menschen können das hochladen von MP3 ' s und Holen Sie MIDI-Dateien zurück), dann sollten Sie mit einem tool wie Melodyne, die ist schon ganz gut läuft. Als Steve merkte, das ist eine sehr schwierige Aufgabe zu erfüllen, und selbst die besten algorithmen und Lösungen präsentieren im moment nicht 100% zuverlässig.

Also, wenn Sie nicht gerade dabei sind studio-Arbeit und müssen noch ein paar Umrechnungen, wird es wahrscheinlich sparen Sie ein wenig Zeit (und einer Menge Kopfschmerzen) ein Werkzeug zu verwenden, die bereits speziell für diese Aufgabe.

InformationsquelleAutor Nik Reiman
1

Delphin, tut mir Leid zu brüsk, aber Sie haben völlig unterschätzt das problem. Was Sie erreichen wollen - ein voller Flügel Klang Transkription unter Einbeziehung aller Parameter, die verwendet wurden, während der Wiedergabe müsste eine enorme Menge an Forschung mit Menschen, die gearbeitet haben, in das Feld für viele Jahre. Sogar eine Gruppe von Doktoranden in der Signalverarbeitung haben würde, zu investieren eine Menge Arbeit, um auch nur annähernd zu dem, was Sie bedeuten. Musik-Transkription ist nötig, in jahrzehntelanger Arbeit zu arbeiten sogar halbwegs zuverlässig. Ich würde vorschlagen, Sie nehmen ein anderes problem, die Sie verwalten können, besser als dieser.

InformationsquelleAutor Thorsten79
1

Dies ist ein Bereich, der noch stark in der Entwicklung, doch es gibt einige (experimentelle) algorithmen zur Verfügung.

Installieren Sie sonic annotator, und verwenden Sie ein paar vamp-plugins.

Beispiel:
```
./sonic-annotator file.wav -d vamp:qm-vamp-plugins:qm-transcription:transcription -w midi

./sonic-annotator file.wav -d vamp:silvet:silvet:notes -w midi

./sonic-annotator file.wav -d vamp:ua-vamp-plugins:mf0ua:mf0ua -w midi
```
InformationsquelleAutor dorien

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.