Beste Weg, um die tokenisierung und zu analysieren Programmiersprachen in meiner Anwendung

Arbeite ich an einem tool, führen Sie einige einfache Transformationen auf Programme (wie extract method). Um dies zu tun, werde ich haben, führen Sie die ersten Schritte der Kompilierung (tokenisierung, analysieren und eventuell Aufbau einer Symboltabelle). Ich werde mit C beginnen und dann hoffentlich verlängern Sie diese aus, um Unterstützung für mehrere Sprachen.

Meine Frage ist, was ist der beste Weg, um diese Schritte auszuführen, dass:

1.) Nicht das Rad neu erfinden. Klar möchte ich nicht schreiben, Flex/Bison-Spezifikationen von hand. Muss ich nur greifen bereits bestehende Spezifikationen und von dort aus arbeiten? Ist Antlr die Art und Weise, hier zu gehen?

2.) Ist erweiterbar auf mehrere Sprachen. Offensichtlich sind das sogenannte Lexing/parsing wird anders sein für jeden, aber ich möchte eine Lösung, die könnte ich leicht erweitern, um auch andere Sprachen. Mindestens ein Satz von Technologien würde, dass diese überschaubar.

BTW, ich bin mit C zu schreiben, für meine Anwendungen

Wenn jemand eine Idee hat, das wäre toll! Danke!

InformationsquelleAutor ChrisDiRulli | 2010-02-12
Schreibe einen Kommentar