PHP clean-up eingefügt Microsoft input

Ich habe eine Website, wo Benutzer können nach Sachen (wie in Foren, Kommentare, etc) mit einem individuellen Umsetzung des TinyMCE. Viele von Ihnen wie copy & paste von Word, d.h. Ihr input kommt oft mit einer fülle von zugehörigen MS inline-Formatierung.

Ich kann nicht einfach loswerden <span whatever> wie TinyMCE basiert auf dem span-tag für einige seiner Formatierung, und ich kann nicht (und will nicht) zwingen, sagte Benutzern für die Verwendung von TinyMCE das "Einfügen Aus Word" - Funktion (die scheint nicht zu funktionieren, dass trotzdem gut).

Wer kennt eine Bibliothek/Klasse/Funktion, die aufpassen würde das für mich? Es muss ein häufiges problem, aber ich kann nichts finden, definitiv. Ich habe mir überlegt, dass vor kurzem eine Reihe von brute-force-regexes suchen für die MS-spezifische Muster, die möglicherweise den trick tun, aber ich will nicht neu schreiben, etwas, dass vielleicht schon zur Verfügung, es sei denn, ich muss.

Auch, die Festsetzung von typografische Anführungszeichen, Gedankenstriche, etc. wäre gut. Ich habe meine eigenen Sachen, dies jetzt zu tun, aber ich würde wirklich nur gerne eine MS-filter, Sie alle zu beherrschen.

InformationsquelleAutor da5id | 2008-12-18
Schreibe einen Kommentar