python reguläre Ausdrücke nichts
Meinem regulären Ausdruck nicht etwas zu tun, um meinen string.
python
data = 'random\n<article stuff\n</article>random stuff'
datareg = re.sub(r'.*<article(.*)</article>.*', r'<article\1</article>', data, flags=re.MULTILINE)
print datareg
bekomme ich
random
<article stuff
</article>random stuff
möchte ich
<article stuff
</article>
- Aw, c ' Mon: Nicht Cthulhu-Analyse wieder.
- es sieht aus wie fehlerhafte HTML zu mir, so dass ich bezweifle, dass ein HTML-parser in der Lage sein würde, mit ihm zu arbeiten, sehr leicht.
- Ich denke, youÄre Recht. Aber die substitution scheint keine gültige XML-entweder. Ich Frage mich, was braucht man gebrochen XML?
Du musst angemeldet sein, um einen Kommentar abzugeben.
re.MEHRZEILIG
eigentlich nicht machen, dein regex mehrzeilig, wie Sie möchten, es zu sein.re.DOTALL
hat:Ändern
flags=re.MULTILINE
zuflags=re.DOTALL
und deine regex funktioniert.