Parsen von HTML mit Hilfe von shell

Ich habe eine HTML mit vielen Daten und Teil ich bin interessiert an:

<tr valign=top>
<td><b>Total</b></td>
<td align=right><b>54</b></td>
<td align=right><b>1</b></td>
<td align=right>0 (0/0)</td>
<td align=right><b>0</b></td>
</tr>

Ich versuche es mal mit awk was jetzt ist:

awk -F "</*b>|</td>" '/<[b]>.*[0-9]/{print $1, $2, $3 }' "index.html"

aber was ich will ist zu haben:

54
1
0
0

Recht jetzt bin ich immer:

'<td align=right> 54'
'<td align=right> 1'
'<td align=right> 0'

Irgendwelche Vorschläge?

  • Ist er der 2.-Letzte null ausgegeben, weil es keine <b> tag oder weil es eine <td> Wert von 0 (0/0)?
InformationsquelleAutor Lenny | 2014-08-18
Schreibe einen Kommentar