Tag: goose
Die Gans Bibliothek ist, laut Ihrer Homepage, ein Html-Inhalt / Artikel-Extraktor in Scala. Es ist mission ist für jeden news-Artikel oder Artikel geben web-Seite und nicht nur extrahieren, was den Hauptteil des Artikels, sondern auch alle meta-Daten und wahrscheinlichste Bild Kandidat.
2
Antworten
Möchte ich zum extrahieren der Titel und die Beschreibung aus der folgenden website: view-source:http://www.virginaustralia.com/au/en/bookings/flights/make-a-booking/ mit den folgenden Ausschnitt des Quellcode: <title>Book a Virgin Australia Flight | Virgin Australia </title> <meta name="keywords" content="" /> <meta name="description" content="Search for