konvertieren Pausen und Absatz bricht in neue Zeile in java
Grundsätzlich habe ich ein HTML-fragment mit <br>
und <p></p>
im inneren. Ich war in der Lage, entfernen Sie alle HTML-tags, aber damit verlässt Sie den text in ein schlechtes format.
Ich möchte etwas wie nl2br()
in PHP, außer stornieren der Eingabe und Ausgabe und berücksichtigt auch <p>
- tags. gibt es eine Bibliothek für die es in Java?
InformationsquelleAutor user91954 | 2010-06-28
Du musst angemeldet sein, um einen Kommentar abzugeben.
Im Grunde muss man ersetzen, jede
<br>
mit\n
und jede<p>
mit\n\n
. Also, an den Punkten, wo es Ihnen gelingt, Sie zu entfernen, müssen Sie die\n
und\n\n
bzw.Hier ein kickoff Beispiel mit Hilfe der Jsoup HTML-parser (HTML-Beispiel ist absichtlich geschrieben, dass die Art und Weise, so dass es schwer, wenn nicht fast unmöglich zu verwenden, regex).
(Hinweis:
replaceAll()
ist unnötig, denn wir wollen einfach nur eine einfache charsequence-von-charsequence Ersatz hier, nicht regexpattern-von-charsequence Ersatz)Ausgabe:
Etwas hacky, aber es funktioniert.
InformationsquelleAutor BalusC
br2nl
undp2nl
sind nicht zu kompliziert. Geben Sie diesem einen Versuch:<br/>
,<br></br>
,<br class="xxx">
usw.. usw..ja, eine in der 'Realität' würde man mit einem html-parser und fügen Sie die Zeile.Separatoren beim extrahieren der text in einem StringBuilder-Objekt 😉 ich hatte das Gefühl, der OP verwendet eine Art von Verknüpfung 😉
InformationsquelleAutor Andreas_D
Sollten Sie in der Lage sein zu verwenden replaceAll. Sehen http://www.rgagnon.com/javadetails/java-0454.html für ein Beispiel. Nur 2 von diesen, eine für p-und einen für br. Das Beispiel geht den anderen Weg, aber Sie können es ändern, um zu ersetzen Sie die html mit Schrägstrich n
InformationsquelleAutor Joelio