Wie man text-Inhalt des gesamten Dokuments?

Ich bin Gebäude Chrome-Erweiterung, die irgendwann feststellen sollte aktuelle Sprache der Seite. Um das zu tun, mein plan ist es, zu extrahieren text-Inhalt der Seite (oder zumindest einen Teil davon) und übergeben es an übersetzungs-api. Aber ich konnte nicht finden die vorwärts Straße Weg zu bekommen, alle textNodes des Dokuments.

Gibt es einen backup-plan, die rekursiv analysieren $('body').contents() bis es genug text-content, aber es fühlt sich ein bisschen schuppig. Vielleicht gibt es einen besseren Weg?

Hinweis: Chrome-Erweiterungen-api können Sie Ihr Skript, um Zugriff auf die user-Seite dom, als ob es das Teil.

  • ist es Weg, könnte man die Verwendung von python ausführbaren Dateien in chrome-extension-Entwicklung? Wenn ja, können Sie SGMLParser aus sgmllib Modul zu erreichen! nicht ganz sicher, wie dies zu tun mit js
  • was tun Sie mit den kompletten html Code der Seite???
InformationsquelleAutor artemave | 2010-11-20
Schreibe einen Kommentar