python reguläre Ausdrücke nichts

Meinem regulären Ausdruck nicht etwas zu tun, um meinen string.

python

data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article\1</article>', data, flags=re.MULTILINE)
print datareg

bekomme ich

random
<article stuff
</article>random stuff

möchte ich

<article stuff
</article>
  • Aw, c ' Mon: Nicht Cthulhu-Analyse wieder.
  • es sieht aus wie fehlerhafte HTML zu mir, so dass ich bezweifle, dass ein HTML-parser in der Lage sein würde, mit ihm zu arbeiten, sehr leicht.
  • Ich denke, youÄre Recht. Aber die substitution scheint keine gültige XML-entweder. Ich Frage mich, was braucht man gebrochen XML?
InformationsquelleAutor user1442957 | 2012-09-12
Schreibe einen Kommentar