Tag: jsoup
Java HTML Parser für die Extraktion und Manipulation von HTML-Daten, mit den besten der DOM -, CSS-und jquery-ähnliche Methoden.
3
Antworten
Ich bin auf der Suche zu tun, einige web-crawling/Schaben und ich Tat etwas Forschung und entdeckt Jsoup. Das einzige problem das ich habe ist mit den Einfuhren. Die videos, die ich geschaut habe und die Beispiele, die
4
Antworten
So, ich Baue eine app, die zeigt ein imageboard von einer website, die ich in einer mehr Benutzer-freundlich-Schnittstelle. Es gibt eine Menge Probleme mit ihm im moment, aber das größte ist im Moment das abrufen der Bilder,
2
Antworten
Ich habe die jsoup Bibliothek jsoup-1.7.1.jar Kern und importiert es, um mein Projekt mit den Projekt -> Eigenschaften->Java Build Path -> Add external Jars und ich klebte die Bibliothek-Datei meine Ordner libs. Jedoch scheint es einige problem
1
Antworten
Wie kann ich diese entfernen: <td> </td> oder <td width="7%"> </td> aus meiner JSoup 'Dokument'? Ich habe versucht, viele Methoden, aber diese non-breaking-space-Zeichen nicht übereinstimmen, nichts mit normalen JSoup Ausdrücke oder Selektoren. Ist es nicht möglich, das Dokument zu
2
Antworten
Möchte ich zum konvertieren einer HTML Seite in MS word. Ich will wissen, was die API hilfreich sein und auch, wenn es irgendeine andere Möglichkeit, das gleiche zu tun. Die gesamte Seite umgebaut werden .doc (zB. Wenn
3
Antworten
muss ich extrahieren Sie ein Bild-tag mit jsoup aus dieser html - <div class="picture"> <img src="http://asdasd/aacb.jpgs" title="picture" alt="picture" /> </div> Brauch ich zu extrahieren der src dieses img-tag ... ich bin mit diesem code erhalte ich die
3
Antworten
Möchte ich teilweise eine Webseite anzuzeigen, die auf webview android zu entfernen und einige div-element der Webseite. Ich habe eine Webseite wie diese <!DOCTYPE html> <body> <div id="a"><p>Remove aa</p></div> <div id="b"><p>bb</p></div> </body></html> Möchte ich nun entfernen Sie
3
Antworten
JSoup scheint zu funktionieren mit so ziemlich allen URLs habe ich versucht, aber dieser gibt mir die 400 Fehler. String url = "http://localad.walmart.com?storeref=3008&forceview=y"; Response response = Jsoup.connect(url.replaceAll(" ", "%20")) .method(Method.GET) .userAgent("Mozilla") .followRedirects(false) .timeout(5000) .data("pragma", "no-cache") .execute(); Fehler
2
Antworten
Ich bin neu mit mit jsoup und ich möchte nur Fragen, wenn ich die jsoup-codes in public static void main als ich gesehen habe, auf dem web auf meine Forschung oder kann ich es in einer anderen
2
Antworten
Ich versuche, diesen http-Anforderung über Jsoup: http://api.decarta.com/v1/[KEY]/batch?requestType=geocode als gegeben hier. Und hier ist mein code für das gleiche: String postUrl=postURLPrefix+apiKey+"/batch?requestType=geocode"; System.out.println(postUrl); String response= Jsoup.connect(postUrl).timeout(60000).ignoreContentType(true) .header("Content-Type", "application/json;charset=UTF-8") .method(Connection.Method.POST) .data("payload",jsonPayload.toString()) .execute() .body(); Den jsonPayload.toString() gibt diese: {"payload":["146 Adkins Street,Pretoria,Pretoria,Gauteng","484
2
Antworten
Kann ich nicht erstellen Sie eine Sitzung mit jsoup und wie die post die Daten mit jsoup. Bitte helfen Sie mir, ich bin neu in jsoup api eigentlich mein code ist: Connection.Response res = Jsoup.connect("https://wiki.my---------------") .userAgent("Mozila") .timeout(0)
2
Antworten
Habe ich <table class="table" > <tr> <td><a href="url">text1</a></td> <td>text2</td> </tr> <tr> <td><a href="url2">text</a></td> <td>text</td> </tr> und ich möchten, extrahieren Sie die url und den text für alle Zeilen Ich benutze Document doc = Jsoup.connect(url).get(); for (Element table
1
Antworten
Ich versuche zu Parsen von HTML-dump von einer bestimmten Seite. Ich verwendet HTML-Parser und auch versucht, JSoup für die Analyse. Fand ich nützliche Funktionen in Jsoup aber ich bin immer 403 Fehler beim Aufruf Document doc =
3
Antworten
import java.io.*; import java.net.URL; import java.net.URLConnection; import java.sql.*; public class linksfind{ public static void main(){ String html = "http://www.apple.com/pr/"; Document document = Jsoup.parse(html); //Can also take an URL. for (Element element : document.getElementsByTag("a")) { System.out.println(element.attr("href")); } }
3
Antworten
Hallo ich bin relativ neu in Java, aber ich bin der Hoffnung, zu schreiben eine Klasse, die finden alle die ALT-Taste (Bild -) Attribute in eine HTML-Datei mit JSOUP. Ich hoffe, dass sich eine Fehlermeldung ausgegeben wird,
2
Antworten
Bekomme ich die folgende XML-Code stellt eine news-Artikel: <content> Some text blalalala <h2>Small subtitle</h2> Some more text blbla <ul class="list"> <li>List item 1</li> <li>List item 2</li> </ul> <br /> Even more freakin text </content> Ich weiß, das
1
Antworten
Ich brauche ein wenig Hilfe, das Verständnis der Grundlagen der Jsoup. Der folgende code funktioniert, aber ich wundere mich, wenn die Verbindung geschlossen werden muss, irgendwie. Kann nichts finden auf der Jsoup website über es. Wenn die
3
Antworten
Ich versuche, alle html zwischen 2 h1-tags. Eigentliche Aufgabe ist es, brechen Sie den html-Code in frames(Kapitel) auf der Grundlage der h1(überschrift 1) tags. Jede Hilfe dankbar. Dank Sunil sind Sie versuchen zu bekommen, '<h1>abc</h1>' abc von
1
Antworten
Habe ich die html-Struktur wie diese. Ich möchte auf die zweite Tabelle, die hat keine Klasse oder id. Wie kann ich die zweite Tabelle aus der iframe? <iframe> <html> <body> <table><table> <table> <tr><td></td></tr> <tr><td></td></tr> </table> </body> </html>
2
Antworten
Ich bin ein Anfänger in der Android-Entwicklung, und ich bin immer dieser Fehler, der verhindert, dass mein Asynctask aus arbeiten mit der Benutzeroberfläche: java.lang.RuntimeException: An error occured while executing doInBackground() at android.os.AsyncTask$3.done(AsyncTask.java:300) at java.util.concurrent.FutureTask.finishCompletion(FutureTask.java:355) at java.util.concurrent.FutureTask.setException(FutureTask.java:222) at
1
Antworten
Ich habe versucht, die Jsoup.connect() Beispiel auf der Jsoup-website und es funktioniert in Java. Aus irgendeinem Grund, ich kann nicht damit es funktioniert in Android Projekte (Eclipse), obwohl ich die Internet-Zugangs-Berechtigung in meinem AndroidManifest. Der Jsoup-Bibliothek richtig
1
Antworten
Habe ich das problem, dass ich so filtern möchten, dass bestimmte Texte, die kann html enthalten. Ich benutze jsoup auf die whitelist und reinigen Sie die tags, die funktioniert sehr schön. Ich habe nur das problem, dass
1
Antworten
Ich habe Probleme mit der Verbindung zu einem url mit JSoup. Die url die ich versuche zu testen ist www.xbox.com/en-US/security das ist eine 302(glaube ich) Umleitung zu http://www.xbox.com/en-US/Live/Account-Security. Ich habe bis jsoup zu Folgen, umleiten und Holen
2
Antworten
Ich versuche zu kratzen, Daten von dieser website: http://www.bundesliga.de/de/liga/tabelle/ Im source-code sehe ich die Tabellen, aber es gibt keinen Inhalt, nur Dinge wie: <td>[no content]</td> <td>[no content]</td> <td>[no content]</td> <td>[no content]</td> .... Mit firebug (F12 im Firefox)
2
Antworten
Ich bin versucht zu erstellen in dem folgenden Beispiel. <body> <resources> <string-array name="mytest"> <item number="1"> <name>Testname</name> </item> <item number="2"> <name>blaat..</name> </item> </string-array> </resources> </body> Ich versuchen, dies auf folgende Weise: FileInputStream fis = openFileInput("test1.xml"); Document doc =
1
Antworten
Habe ich einige HTML (String), dass ich durch putting-Jsoup nur so kann ich etwas hinzufügen, um alle href-und src-Attributen, das funktioniert auch. Aber ich bin zu bemerken, dass für einige spezielle HTML-Zeichen, Jsoup ist die Umwandlung von
3
Antworten
Derzeit arbeite ich mit einem <ul> element mit einer Menge first-level - <li> Elemente. Ich möchte, um diese Elemente, und nur diese Elemente. Allerdings, wenn ich Sie entweder mit Jsoup-Selektor oder getElementsByTag, es gibt auch <li> Elemente
3
Antworten
Ich habe eine html-Tabelle mit einer ID von thetable. Es hat (laut FireBug), eine Unbenannte TBODY-tag, und eine Unbenannte TR-tag. Die drei TD-tags drinnen, dass ich zugreifen will, sind Unbenannt. Gibt es eine CSS-Selektor -, dass ich
2
Antworten
Ich bin versucht zu Holen, die tatsächliche(Weiterleitung) - url, von der eine durch einen url-shortener. Nehmen wir twitter url shortener zum Beispiel. Ich bin in der Lage, um die response-Objekts auch analysiert es, um das Dokument. Response
1
Antworten
Ich kann nicht scheinen, laden einer lokalen html-Datei, mit der Jsoup-Bibliothek. Oder zumindest scheint es nicht zu sein, erkennen es. Ich hardcoded die genaue html in der lokalen Datei (wie die var 'html') und wenn ich wechseln
2
Antworten
Ich versuche zu laufen ein web-scraper in Eclipse, dass mit Jsoup, der die Namen der Professoren auf dieser Seite: yu.edu/faculty und drucken Sie Sie aus. Das ist mein code: import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element;
2
Antworten
Ich habe ein Div-tag als unten <div id="eventTTL" style="text-transform: uppercase; font-weight: 900;" eventTTL="4583476000">5 days 07:14:41</div> Wie bekomme ich den Wert von eventTTL? Ich möchte den Wert anzuzeigen, der eventTTL ie:) "4583476000". Was für ein Teil brauchen Sie
1
Antworten
Ich versuche zu krabbeln werden die Bewertungen des Benutzers der Kino-Filme auf imdb von der review-Seite: (Anzahl der Filme in meiner Datenbank ist mit rund 600.000). Ich verwendet jsoup Parsen Seiten wie folgt: (sorry, ich habe nicht
1
Antworten
Ich wollte Fragen, hat jemand ein Beispiel-eclipse-Projekt mit einer funktionierenden Umsetzung von JSoup? Im Versuch, es zu verwenden, um den Abruf von Informationen von Webseiten und sind gegangen, alle über google versucht, es zu erhalten zu arbeiten,
3
Antworten
wie kann ich parse den text aus einer web-Seite mit jsoup mit java? InformationsquelleAutor Jesvin | 2010-08-17
1
Antworten
Hier ist der Teil, der den HTML-Code (vereinfacht für die Frage): <a href="/auctions?id=4672" class="auction sec"> <div class="progress"> <div class="guarantee"> <img src="/img/ico/2.png" /> </div> </div> </a> <a href="/auctions?id=4670" class="auction"> <div class="progress"> <div class="guarantee"> <img src="/img/ico/1.png" /> </div> </div>
2
Antworten
Habe ich diesen html-code, den ich brauche, um zu analysieren <a class="sushi-restaurant" href="/greatSushi">Best Sushi in town</a> Ich weiß, es ist ein Beispiel für jsoup, dass man alle links in einer Seite,z.B. Elements links = doc.select("a[href]"); for (Element
4
Antworten
Brauche ich zum extrahieren von text aus einem Knoten wie dieser: <div> Some text <b>with tags</b> might go here. <p>Also there are paragraphs</p> More text can go without paragraphs<br/> </div> Und ich muss bauen: Some text <b>with
4
Antworten
In jsoup Element.children() gibt alle Kinder (Abkömmlinge) des Elements. Aber, ich will das Element der ersten Ebene Kinder (direkte Kinder). Welche Methode kann ich verwenden? Element.children() gibt direkte Kinder, ist es nicht? Wenn Sie im Zweifel sind,
2
Antworten
Ich bin mit Jsoup Parsen der html-Datei und ziehen Sie alle sichtbaren text aus Elementen. Das problem ist, dass es einige html-bit in javascript-Variablen, die werden offensichtlich ignoriert. Was wäre die beste Lösung, um die bits aus?
2
Antworten
Ich habe eine Tabelle tag <table width="100%" align="center"/> Und so weit Jsoup bietet Document document =Jsoup.parse(htmlString); document.select("table[width=100%],table[align=center]"); Und das ist ODER Verbindung, d.h. wenn eine passt dann Elemente ausgefüllt sind. Damit wählen Sie eine Tabelle mit width
2
Antworten
Habe ich übersetzt die PHP Simple HTML DOM - Abfrage: $article->find('td[id$=tdDescription] div a', 1)->plaintext; den jsoup - Abfrage: resultRow.select("td[id$=tdDescription] > div > a").first().text()); wie Sie sehen können ich bin acessing die zweite (1) Ergebnis in PHP, aktuell
2
Antworten
Durch die Verwendung von Jsoup ich parse HTML von einer website zum Auffüllen einer ArrayList mit, was ich brauchte, zu Holen von der website. So, jetzt habe ich eine ArrayList ist gefüllt mit strings. Ich möchte zu
8
Antworten
Ich arbeite mit eclipse Version: Indigo Service Release 2 Build id: 20120216-1857. Die Android-version ist 2.2. Ich mache eine app zu testen verbinden Sie und analysieren Sie eine web-Seite wie diese: public class TestActivity extends Activity {
4
Antworten
Ich habe Folgendes html: <div> <h1> <a>1</a> </h1> <h2> <a>2<a> </h2> <h3> <a>3</a> </h3> </div> Gibt es einen besseren Weg, um wählen Sie alle Anker als div > h1 > a, div > h2 > a, div
1
Antworten
Ich versuche zu analysieren, eine nicht wohlgeformte DTD html Datei, die ich abrufen, die von einem inputstream mit JSOUP, und erhalten Sie alle Daten in das TD-Felder. Wie kann ich das machen mit JSoup? Ich sah schon
3
Antworten
Arbeite ich an einer Android app, die lädt man eine HTML-Seite und zeigt es in einem webview. Das problem ist, ich möchte hinzufügen, meine custom-css (das geladene HTML hat keine CSS-oder einen link zu einer css). Wie
1
Antworten
Möchte ich submit form von einer Webseite, die mehrere Formen. Ich möchte dieses Formular abgesendet haben unten im besonderen. <form action="realDisplay.asp" method="post" name="Search" onSubmit="return validate(this); return submitForm();" target="_blank"> <table width="98%" align="center" cellspacing="0" cellpadding="0" border="1" bordercolor="#FFFFFF"> <tr> <td
4
Antworten
Wie könnte ich Jsoup zu extrahieren Spezifikation Daten aus diese website separat für jede Zeile, z.B. Netzwerk->Netzwerk-Typ, Batterie usw. import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public class mobilereviews { public static void main(String args) throws
3
Antworten
Ich versuche zu integrieren, j-Suppe-Bibliothek in android studio. Ich bin immer Fehler. StackTrace: Gradle: A problem occurred configuring root project 'JsoupProject'. Nicht darüber informiert Projekt-evaluation Zuhörer. Haupt-Manifest fehlt C:\Users\Asthme\Androidstudio\JsoupProject\src\main\AndroidManifest.xml Einstellungen .gradle: include ':Jsoup' include ':libraries:jsoup-1.7.2.jar' Bauen.gradle buildscript