Python: strip html aus text-Daten

Meine Frage ist leicht mit Bezug auf: Strip HTML aus strings in Python

Ich bin auf der Suche nach einem einfachen Weg, um Streifen HTML-code aus dem text. Zum Beispiel:

string = 'foo <SOME_VALID_HTML_TAG> something </SOME_VALID_HTML_TAG> bar'
stripIt(string)

Würde dann ergeben foo bar.

Gibt es irgendein einfaches Werkzeug zum erreichen dieser in Python? Der HTML-code könnte verschachtelt werden.

  • Ich denke, dass Sie vielleicht wollen, verwenden Sie die akzeptierte Antwort auf die Frage, die Sie verbunden - wie, was machst du anders?
  • In dem Zusammenhang Frage, der user wollte stripIt('<HTML_TAG>foo</HTML_TAG>') ergeben foo, während in meinem Fall, ich will es zurück ".
  • Recht - mein Fehler. Ich wollte nicht sehen, die Bearbeiten, um Ihre Frage, und dachte, dass something war der tag Sie wollte abgestreift.
  • ist "SOME_VALID_HTML_TAG" auf einen bestimmten tag? Wollen Sie der äußerste tag entfernt werden?
InformationsquelleAutor Jernej | 2011-01-05
Schreibe einen Kommentar