Wie konvertieren von HTML-zu-Markdown-unter Beibehaltung non-markdown in HTML-tags?
Ich würde gerne in der Lage sein, um eine vorhandene HTML-snippet und konvertieren Sie es in markdown.
Ich habe versucht pandoc für diesen Zweck:
pandoc test.html -o test.md
wo test.html sah so aus:
Hello
<!-- more -->
and some more text
<h2>some heading</h2>
Das Ergebnis war dieses:
Hello and some more text
some heading
------------
So, es konvertiert nicht nur tags, die eine direkte Bedeutung in markdown. Es entfernt auch tags, die möchte ich behalten als HTML-Code (z.B. HTML-Kommentare, iframe
- tags, und so weiter).
- Wie kann ich konvertieren von HTML zu markdown in einer Weise, dass alle tags, die nicht ein äquivalent in markdown werden beibehalten, die als raw-HTML?
- Mehr allgemein, wie kann ich Steuern, wie die HTML-zu-markdown-Konvertierung fertig ist?
Insbesondere würde mich interessieren Kommandozeilen-Programm-Optionen. Zum Beispiel, vielleicht gibt es Optionen, die versorgt werden können pandoc.
- interessant, ich habe genau das umgekehrte problem. Es hält die divs ich habe zwar nicht danach gefragt
Du musst angemeldet sein, um einen Kommentar abzugeben.
Nach ein bisschen suchen habe ich gelesen, dass die
--parse-raw
option in einem thread auf Tabelle analysieren.Hinzufügen der
--parse-raw
option schien nicht zu entfernen der nicht-markdown entsprechende HTML-tags.--parse-raw/-R
entfernt wurde. Verwenden+raw_html
oder+raw_tex
Erweiterung.+raw_html
oder+raw_tex
Erweiterung vorgeschlagen