So entfernen Sie Leerzeichen in BeautifulSoup

Ich habe eine Reihe von HTML-ich bin parsing mit BeautifulSoup und es läuft ziemlich gut, außer für einen kleinen Haken. Ich möchte speichern Sie die Ausgabe in eine single-gefüttert-string, mit dem folgenden, da meine aktuelle Ausgabe:

    <li><span class="plaincharacterwrap break">
                    Zazzafooky but one two three!
                </span></li>
<li><span class="plaincharacterwrap break">
                    Zazzafooky2
                </span></li>
<li><span class="plaincharacterwrap break">
                    Zazzafooky3
                </span></li>

Idealerweise möchte ich

<li><span class="plaincharacterwrap break">Zazzafooky but one two three!</span></li><li><span class="plaincharacterwrap break">Zazzafooky2</span></li>

Es gibt eine Menge von überflüssigen Leerzeichen, die ich loswerden möchte, aber es ist nicht unbedingt abnehmbar mit strip(), noch kann ich krass entfernen Sie alle Leerzeichen, da muss ich beibehalten, der text. Wie kann ich es tun? Wie es scheint, eine gemeinsame genug problem, regex wäre übertrieben, aber ist das die einzige Möglichkeit?

Habe ich keine <pre> - tags, so kann ich ein wenig eindringlicher da.

Noch einmal vielen Dank!

Wie drucken Sie Ihr Ergebnis?
Sie können tun, was Browser tun: den Zusammenbruch aller angrenzenden whitespaces (im text) in einzelne Räume.

InformationsquelleAutor Rio | 2010-11-24

Schreibe einen Kommentar