Mit grep, um das nächste WORT nach einem Spiel in jeder Linie

Möchte ich, um die "BEKOMMEN" Abfragen aus meiner server-logs.

Dies ist ein Beispiel für den server-log -

1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:32:27] code 404, message File not fo$
1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:32:27] "GET /hello HTTP/1.1" 404 -   
1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:41:57] code 404, message File not fo$
1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:41:57] "GET /ss HTTP/1.1" 404 -

Wenn ich versuche mit einfachen grep oder awk,

Adi:~ adi$ awk '/GET/, /HTTP/' serverlogs.txt

gibt es

1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:32:27] "GET /hello HTTP/1.1" 404 -
1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:41:57] "GET /ss HTTP/1.1" 404 -

Ich will nur anzeigen : Hallo und ss

Gibt es eine Möglichkeit dies getan werden könnte?

InformationsquelleAutor aditya.gupta | 2012-06-10

grep linux

12

Vorausgesetzt, Sie haben gnu grep verwenden, können Sie perl style regex zu tun, eine positive lookbehind:
```
grep -oP '(?<=GET\s/)\w+' file
```
Wenn Sie nicht über gnu grep, dann würde ich raten, nur mit sed:
```
sed -n '/^.*GET[[:space:]]\{1,\}\/$[-_[:alnum:]]\{1,\}$.*$/s//\1/p' file
```
Wenn Sie gnu sed, das kann stark vereinfacht werden:
```
sed -n '/^.*GET\s\+\/$\w\+$.*$/s//\1/p' file
```
Hier die Quintessenz ist, Sie sicherlich nicht brauchen, Rohre, dies zu erreichen. grep oder sed allein genügt.
- Genial. Funktioniert perfekt!! Kurze und einfache.
InformationsquelleAutor Tim Pote
6

In diesem Fall, da die log-Datei hat eine bekannte Struktur, eine Möglichkeit ist die Verwendung Ausschneiden zu ziehen, die 7. Spalte (Felder sind gekennzeichnet durch Registerkarten standardmäßig).
```
grep GET log.txt | cut -f 7 
```
- Noch zeigt sich die gesamte Zeile. 1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:32:27] "GET /hello HTTP/1.1" 404 - 1.0.0.127.in-addr.arpa - - [10/Jun/2012 15:41:57] "GET /ss HTTP/1.1" 404 -
- Hmmm, ist es space-oder tab-getrennt? Wenn der Raum, verwenden Sie -d' ' mit cut angeben Leerzeichen als Spaltentrennzeichen.
- Funktioniert Super mit der -d ' ' - Parameters.
InformationsquelleAutor John Carter
3

verwenden Sie ein Rohr, wenn Sie mit grep:
```
grep -o /he.* log.txt | grep -o [^/].*
grep -o /ss log.txt | grep -o [^/].*
```
[^/] bedeutet, extrahieren Sie die Buchstaben nach dem ^ - symbol aus der grep-Ausgabe

InformationsquelleAutor Charles Chow
2

War ich versucht, dies zu tun und kam über diesen link: https://www.unix.com/shell-programming-and-scripting/153101-print-next-word-after-found-pattern.html

Zusammenfassung:
mit grep finden Sie passende Zeilen, dann verwenden awk zu finden, die Muster und drucken Sie mit dem nächsten Feld:
```
grep pattern logfile | \
  awk '{for(i=1; i<=NF; i++) if($i~/pattern/) print $(i+1)}'
```
Wenn Sie wissen möchten, das einzigartige vorkommen:
```
grep pattern logfile | \
  awk '{for(i=1; i<=NF; i++) if($i~/pattern/) print $(i+1)}' | \
  sort | \
  uniq -c
```
InformationsquelleAutor ajp619
1

Es ist oft einfacher, verwenden Sie eine pipeline, sondern als eine einzige komplexe reguläre Ausdrücke. Dieser arbeitet auf den Daten, die Sie zur Verfügung gestellt:
```
fgrep GET /tmp/foo | 
    egrep -o 'GET (.*) HTTP' |
    sed -r 's/^GET \/(.+) HTTP/\1/'
```
Diese pipeline liefert die folgenden Ergebnisse:
```
hello
ss
```
Gibt es sicherlich andere Möglichkeiten, um den job zu erledigen, aber diese offenkundig funktioniert, auf den Korpus.

InformationsquelleAutor Todd A. Jacobs
0
```
gawk '{match($7,/\/(\w+)/,a);} length(a[1]){print a[1]}' log.txt
hello
ss
```
Wenn Sie gawk dann obigen Befehl verwenden match Funktion wählen Sie den gewünschten Wert mithilfe von regex und speichern in ein array a.

InformationsquelleAutor P....

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.