Tag: nokogiri
HTML -, XML -, SAX-und Reader-parser für Ruby, mit der Möglichkeit zum durchsuchen von Dokumenten mit Hilfe von XPath-oder CSS3-Selektoren,… und vieles mehr
1
Antworten
betrachten Sie diese Liste der Alkohol Beer <br> Vodka <br> rum <br> whiskey wie würden Sie Ausdrücken, Bier in xpath ? /br/preceding-sibling::text() ? was ist mit Wodka ? rum ? Sie haben als DOM-parser, statt ein XML-parser?
3
Antworten
Kann ich einrichten analysieren und eine Verbindung zu einer Website, aber, wenn ich das Skript ausführen, es gibt eine leere Knotenmenge: require 'rubygems' require 'mechanize' require 'nokogiri' require 'ap' time = Time.new url = <<-EOS 'http://www.events.psu.edu/cgi-bin/cal/webevent.cgi?cmd=listday&y=%d&m=%d&d=%d&cat=&sib=1&sort=m,e,t&ws=0&cf=list&set=1&swe=1&sa=1&de=1&tf=0&sb=1&stz=Default&cal=cal299' %
2
Antworten
Ich bin Parsen einer XML-Datei mit Nokogiri mit dem folgenden snippet: doc.xpath('//root').each do |root| puts "# ROOT found" root.xpath('//page').each do |page| puts "## PAGE found /#{page['id']} /#{page['name']} /#{page['width']} /#{page['height']}" page.children.each do |content| ... end end end Wie
4
Antworten
Ich versuche Durchlaufen einer Ordner-Struktur in XML mit Nokogiri, aber ich bin stecken in diesem: <test> <folder name="Folder A"> <folder name="Folder A1"> <file name="a.txt">Cool file</file> </folder> <folder name="Folder A2"></folder> </folder> <folder name="Folder B"> <folder name="Folder B1"></folder> <folder
1
Antworten
Muss ich parse eine XML-Datei in Ruby Objekte. Gibt es ein tool zum Lesen von Attributen von XML, wie dies report.system_slots.items gibt ein array von Element-Eigenschaften, oder report.system_slots.current_usage Rückkehr 'zur Verfügung'? Ist es möglich, dies zu tun
1
Antworten
Ich versuche, Ruby ' s Nokogiri Parsen groß (1 GB oder mehr) in XML-Dateien. Ich bin testen von code auf eine kleinere Datei, mit nur 4 Datensätze hier erhältlich. Ich bin mit Nokogiri version 1.5.0, Ruby 1.8.7
2
Antworten
Habe ich eine xml-doc mit Nokogiri: Nokogiri::XML::Document Kopfteil der Datei ist <?xml version="1.0"?> aber ich würde erwarten, dass <?xml version="1.0" encoding="UTF-8"?>. Gibt es irgendwelche Optionen, die ich verwenden könnte, damit die Codierung wird ? InformationsquelleAutor Luc |
2
Antworten
Das Problem Ich bin mit einigen Statistiken, die gegen verschiedene URLS. Ich möchte finden Sie die top-level-element mit der dichtesten Zahl der Kinder. Die Methode, die ich möchte zu Folgen, um zu ermitteln alle top-level-Elemente und dann
6
Antworten
Habe ich versucht zu installieren, Ruby on Rails, basierend auf diese Anweisungen. Aber, ich erhalte die folgende Fehlermeldung beim ausführen gem install rails -v 4.2.4: Fetching: rack-1.6.4.gem (100%) Successfully installed rack-1.6.4 Building native extensions. This could take
2
Antworten
Schrieb ich test für Modell: describe Video do describe 'searching youtube for video existence' do it 'should return true if video exists' do Video.video_exists?("http://www.youtube.com/watch?v=KgfdlZuVz7I").should be_true end end end Hier ist der Modell-code: class Video < ActiveRecord::Base attr_accessible
1
Antworten
Nicht sicher, warum bin ich immer die folgende Fehlermeldung, wenn die URI Prima funktioniert, im browser: http://oracleofbacon.org/cgi-bin/xml?a=Kevin Bacon&b=Tom Cruise&u=1&p=google-apps Dies ist mein code: def kb(to) uri = "http://oracleofbacon.org/cgi-bin/xml?a=Kevin Bacon&b=#{to.strip}&u=1&p=google-apps" doc = Nokogiri::XML(open(uri)) # throws error on this
2
Antworten
Bemerkte ich etwas seltsames mit Nokogiri vor kurzem. Alle HTML ich hatte parsing gegeben hatte Anfang und Ende <html> und <body> tags. <!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.0 Transitional//EN\" \"http://www.w3.org/TR/REC-html40/loose.dtd\">\n<html><body>\n Wie kann ich verhindern, dass Nokogiri aus,
3
Antworten
Ich habe ein Programm, dass die Schrammen Wert von https://web.apps.markit.com/WMXAXLP?YYY2220_zJkhPN/sWPxwhzYw8K4DcqW07HfIQykbYMaXf8fTzWT6WKnuivTcM0W584u1QRwj Mein aktuelle code: doc = Nokogiri::HTML(open(source_url)) puts doc.css('span.indexDate').text date = doc.css('span.indexDate').text date = Date.parse(date) puts date values = doc.css('table#CdsIndexTable td.col2 span') puts values Diese schabt das Datum
2
Antworten
Ich Habe ein HTML-Dokument mit Verlinkungen, zum Beispiel: <html> <body> <ul> <li><a href="http://someurl.com/etc/etc">teste1</a></li> <li><a href="http://someurl.com/etc/etc">teste2</a></li> <li><a href="http://someurl.com/etc/etc">teste3</a></li> <ul> </body> </html> Möchte ich mit Ruby on Rails, mit nokogiri oder eine andere Methode, um eine endgültige doc so:
1
Antworten
Habe ich die folgende einfache XML-Datei. <?xml version="1.0"?> <user-mapping> </user-mapping> Möchte ich hinzufügen, dass Inhalte, um das user-mapping mit Nokogiri. Dies ist mein code: f = File.open("exam.xml") doc = Nokogiri::XML(f) puts doc.to_s map = doc.at_css "user-mapping" map.content
3
Antworten
Habe ich die Homepage, die ich brauche, um zu kratzen, einige Daten aus. Das problem ist, dass jede Seite, die möglicherweise oder möglicherweise nicht über spezifische Daten, oder es kann zusätzliche Daten oben oder unten in den
3
Antworten
Bin ich versucht zu installieren, das Nokogiri-gem unter einem RVM verwaltet Ruby 1.8.7 installation von OS X Leopard (10.5.8). Bin ich immer die folgende Fehlermeldung: Building native extensions. This could take a while... ERROR: Error installing nokogiri:
1
Antworten
Ich installiert Nokogiri ohne Probleme durch läuft: $ sudo gem install nokogiri Building native extensions. This could take a while... Successfully installed nokogiri-1.5.9 1 gem installed Installing ri documentation for nokogiri-1.5.9... Installing RDoc documentation for nokogiri-1.5.9... Wenn
1
Antworten
z.B. ich habe html: <div class="item"> <p> bla bla<br/> bla bla </p> </div> ich brauche, um die innere html von div.item: <p> bla bla<br/> bla bla </p> ich weiß, dass ich kann verwenden: doc.css("div.item:first").text text-Methode return sauberen
4
Antworten
Gegeben, das XML in einen string namens "Text": <Guide> <Master> <Part>12345</Part> <Sub> <Name>A</Name> </Sub> <Sub> <Name>B</Name> </Sub> </Master> <Master> <Part>XYZABC</Part> <Sub> <Name>A</Name> </Sub> <Sub> <Name>C</Name> </Sub> </Master> </Guide> Und diese code-Zeile: bgdoc = Nokogiri::XML::DocumentFragment.parse(xstring.to_xml) Möchte ich eine
2
Antworten
Ich bin Parsen von einem XML-Dokument, das wie folgt aussieht: <MyBook> <title>Favorite Poems</title> <issn>123-456</issn> <pages>45</pages> </MyBook> <MyBook> <title>Chocolate Desserts</title> <issn>654-098</issn> <pages>100</pages> </MyBook> <MyBook> <title>Jabberwocky</title> <issn>454-545</issn> <pages>19</pages> </MyBook> Ich xpath verwenden, um ziehen Sie die MyBook Knoten und
4
Antworten
Ich versuche, um loszulegen mit Nokogiri. Ich lief den Befehl gem install nokogiri als administrator in Windows 7 (64-Bit). Die Konsole sagt "erfolgreich installiert" und "1 gem installed". Geben, wenn ich in gem list --local OR gem
2
Antworten
Gibt es irgendeine saubere Möglichkeit, um die Inhalte von text-Knoten mit Nokogiri? Jetzt bin ich mit some_node.at_xpath( "//whatever" ).first.content scheint wirklich ausführlich für immer nur der text. InformationsquelleAutor cbmanica | 2012-08-16
6
Antworten
Ich versuche, füllen Sie die Variablen parent_element_h1 und parent_element_h2. Kann mir jemand helfen, verwenden Sie Nokogiri zu Holen Sie sich die Informationen, die ich brauche in diesen Variablen? require 'rubygems' require 'nokogiri' value = Nokogiri::HTML.parse(<<-HTML_END) "<html> <body>
2
Antworten
Habe ich code wie diesen: @doc = Nokogiri::HTML(open(url) @doc.xpath(query).each do |html| puts html # how get content of a node end Wie bekomme ich den Inhalt der Knoten, sondern so etwas wie dieses: <li class="stat"> InformationsquelleAutor John
2
Antworten
Ich gerade angefangen mit Nokogiri an diesem morgen, und ich Frage mich, wie so führen Sie eine einfache Aufgabe: ich muss nur suchen, eine Webseite für ein div-Element wie diesem: <div id="verify" style="display:none"> site_verification_string </div> Ich will,
1
Antworten
Habe ich eine XPath-Abfrage, die so aussieht, mit einfachen und doppelten Anführungszeichen. Wie kann ich entkommen das Apostroph richtig so, dass die Abfrage funktioniert? Habe ich versucht: "//li[text()='Frank's car']" aber es scheint nicht, es zu tun für
1
Antworten
Ich versuche, fügen Sie untergeordnete Knoten unter einem root-Knoten .. habe ich ausprobiert, darunter xml, aber das funktioniert nicht. Ich bin Neuling auf Ruby und Nokogiri builder = Nokogiri::XML::Builder.with(@doc) do |xml| nodes = Nokogiri::XML::NodeSet.new(@doc, ) .each {|nodes_one_by_one|
1
Antworten
Ich bin mit Nokogiri mit Ruby interpretieren den Inhalt einer XML-Datei. Ich würde gerne ein array (oder ähnlich) von allen Elementen, die direkte Kinder von <where> in meinem Beispiel. Allerdings bin ich immer verschiedene text-Knoten (z.B. "\n\t\t\t"),
4
Antworten
Gibt es viele Beispiele, wie Streifen HTML-tags aus einem Dokument mithilfe von Ruby-Hpricot und Nokogiri haben inner_text Methoden entfernen aller HTML-Codes, die Sie einfach und schnell. Was ich versuche zu tun, ist das entgegengesetzte, entfernen Sie den
5
Antworten
Ich habe eine große XML-Datei (über 10K Zeilen), die ich brauche, um zu analysieren regelmäßig in diesem format: <summarysection> <totalcount>10000</totalcount> </summarysection> <items> <item> <cat>Category</cat> <name>Name 1</name> <value>Val 1</value> </item> ...... 10,000 more times </items> Was ich möchte
9
Antworten
Es gibt keinen Tag an SO, der vergeht, ohne eine Frage zu Parsen von (X)HTML-oder XML mit regulären Ausdrücken gefragt. Es ist zwar relativ einfach zu kommen mit Beispiele, wie der nicht-Lebensfähigkeit von regexes für diese Aufgabe
4
Antworten
Ich eine saubere Installation von Ruby 2.2.1 auf Windows 8.1 mit DevKit. Nach der installation habe ich ausgeführt: gem install rails rails new testapp cd testapp rails server verlassen, alles andere auf Standard. Scheitert der Prozess in
3
Antworten
Schiebe ich eine rails-app auf appfog, bekam aber folgende Fehlermeldung: /var/vcap.lokale/dea/apps/superb-0-dc92a2e492e46c40c06d2abc3ad59841/app/rubygems ruby/1.9.1/gems/bundler-1.1.3/lib/bundler/resolver.rb:129:in `block in beheben' Bundler nicht finden konnte kompatible Versionen für gem "nokogiri": (Bundler::Versi nConflict) snapshot (Gemfile.lock): nokogiri (1.5.6) Im Gemfile: capybara (= 1.1.2) ruby hängt
2
Antworten
Habe einige Probleme bekommen, das richtige setup für Nokogiri und deren Dokumentation ist ein wenig rau zu bekommen begann mit. Ich versuche die XML-Datei analysiert: http://www.kongregate.com/games_for_your_site.xml Gibt mehrere Spiele innerhalb der gameset, und für jedes Spiel hat
8
Antworten
Beim Bundle Install ausführt oder Gem Install Nokogiri, bekomme ich die gleiche Ausgabe, die verhindert, dass meine app nicht ausgeführt werden. Ich vermute, das Problem ist lokal und kam aus beweglichen alles bis auf Schienen 5, aber
2
Antworten
Ich bin extrahieren von Daten aus einem forum. Mein Skript basierend auf ist in Ordnung. Jetzt muss ich extrahieren von Datum und Uhrzeit (21 Dez 2009, 20:39) aus einzelnen Beitrag. Ich kann es nicht arbeiten. Ich verwendet
2
Antworten
Ich bin mit Mechanize zu kratzen, Google Wallet, Um Daten. Ich bin die Erfassung aller Daten von der ersten Seite, ich muss jedoch automatisch ein link auf den nachfolgenden Seiten erhalten Sie weitere Informationen. #PurchaseOrderPager-pagerNextButton wird sich
1
Antworten
Ich bin ganz neu Schienen. Ich mache eine web-Anwendung, in der ich bin mit nokogiri für die Suche verschiedene Webseiten zum extrahieren von text aus Ihnen. Und so in der Gemfile, das habe ich geschrieben require 'nokogiri'
1
Antworten
Habe ich eine einfache Rails-app, die gut funktioniert auf localhost (Mac OS X), aber wenn ich es bereitstellen zu Heroku sehe ich eine Seite mit diesem Fehler: Application Error Ein Fehler ist aufgetreten in der Anwendung und
1
Antworten
Bin ich lernen, wie man nokogiri und paar Fragen zu mir kam, basiert auf dem code unten require 'rubygems' require 'mechanize' post_agent = WWW::Mechanize.new post_page = post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708') puts "\nabsolute path with tbody gives nil" puts post_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div[2]').xpath('text()').to_s.strip.inspect puts
1
Antworten
Ich bin erst am Anfang mit Nokogiri und habe eine Frage, hoffe, Euch kann mir helfen: Muss ich parse ein Satz von XML-Dateien (sagen wir mal 5 Dateien). Die Elemente mit bestimmten Werten, z.B. Stadt = "London"
4
Antworten
Ich habe versucht, Nokogiri auf meinem computer installiert (Mountain Lion) zu verwenden mit rspec und capybara, aber für das Leben von mir, ich kann Sie nicht richtig zum laufen. Was ich sagen kann, ist das Problem mit
2
Antworten
Ich versuche, das nokogiri gem extrahieren Sie alle urls auf der Seite auch Ihren link-text und speichern Sie den link-text und die url in einen hash. <html> <body> <a href=#foo>Foo</a> <a href=#bar>Bar </a> </body> </html> Ich würde
2
Antworten
grundsätzlich möchte ich wählen Sie einen Knoten (div), in dem es die Kinder-Knoten(h1,b,h3) enthalten angegebenen text. <html> <div id="contents"> <p> <h1> Child text 1</h1> <b> Child text 2 </b> ... </p> <h3> Child text 3 </h3> </div>
4
Antworten
Ich bin momentan dabei, eine kleine app für mich wo ich das ausführen eines Ruby-Skripts und speichern Sie alle Bilder aus meinem blog. Ich kann nicht herausfinden, wie um das Bild zu speichern Dateien, nachdem ich habe
3
Antworten
Habe ich dieses: <a class="top_level_active" href="javascript:Submit('menu_home')">Account Summary</a> Möchte ich auf diesen link klicken, aber ich erhalte eine Fehlermeldung, wenn mit link_to. Ich versucht habe: bot.click(page.link_with(:href => /menu_home/)) bot.click(page.link_with(:class => 'top_level_active')) bot.click(page.link_with(:href => /Account Summary/)) Den Fehler den
5
Antworten
Ich versuche Schienen zu arbeiten, auf Windows 10. Ich bin mit Ruby 2.3.0, und Schienen 4.2.6, und bin vorübergehend mit Nokogiri 1.6.3. Wenn ich versuche, ausgeführt rails new demo ist, gibt es einen Fehler: An error occurred
4
Antworten
Wenn ich versuche zum ausführen eines ruby on rails Projektes bekam ich eine Fehlermeldung: An error occurred while installing nokogiri (1.5.2), and bundle cannot continue. Make sure that 'gem install nokogiri -v 1.5.2 succeed before building. Arbeite
2
Antworten
Habe ich das folgende XML-Dokument: <samlp:LogoutRequest ID="123456789" Version="2.0" IssueInstant="200904051217"> <saml:NameID>@NOT_USED@</saml:NameID> <samlp:SessionIndex>abcdefg</samlp:SessionIndex> </samlp:LogoutRequest> Ich würde gerne den Inhalt der SessionIndex ('abcdefg'). Ich hab das versucht: XPATH_QUERY = "LogoutRequest[@ID][@Version='2.0'][IssueInstant]/SessionIndex" SAML_XMLNS = 'urn:oasis:names:tc:SAML:2.0:assertion' SAMLP_XMLNS = 'urn:oasis:names:tc:SAML:2.0:protocol' require 'nokogiri' doc =