PHP Regex HTML - URL Extrahieren
Ich versuche zu extrahieren mehrere URLs aus HTML-Datei mit regex.
Es gibt andere URLs in die Datei, gehen Sie nur Muster, die ich habe ist "tableentries." und ""
HTML-code Beispiel:
<tr class="tableentries2">
<td>
<a href="http://example.com/all-files/files/00000000789/">Click Here</a>
</td>
PHP ich schrieb:
$html = "value of the code above"
if(preg_match_all('/<td>.*</td>/', $html, $match)){
foreach($match[0] as $x){
echo $x . "<br>";
}}
- Was ist Ihre Frage genau? was bedeutet dieser code erhalten Sie? warum hat es nicht funktioniert?
- Anführungszeichen fehlen, um Ihre HTML-Attribute.
<tr class="tableentries2"> ... <a href="http://example.com/...">
(bearbeitet deine Frage) - Vielleicht verwenden Sie ein DOM-parser wie simplehtmldom.sourceforge.net
Du musst angemeldet sein, um einen Kommentar abzugeben.
Warum nicht einfach suchen
href
Werte? (Aktualisiert, da der bearbeitete code hat jetzt Anführungszeichen.)Dann die URI wäre in
$match[1][0]
.Sollten Sie wirklich nicht verwenden, regex zum Parsen von HTML. DOMDocument ist eigentlich sehr einfach zu verwenden für diese Art der Sache. hier ist ein einfaches Beispiel.
Diese ausgeben würde:
$link->nodeValue
. hier ist ein Beispiel: codepad.viper-7.com/JBsfP1