In grep auf Ubuntu, wie kann ich nur den string, der auf den regulären Ausdruck?

Ich bin grundsätzlich grepping mit einem regulären Ausdruck auf. In der Ausgabe würde ich gerne sehen, nur die strings passen meine reg-exp.

In eine Reihe von XML-Dateien (meistens sind Sie single-line-Dateien, die mit riesigen Mengen an Daten, die in einer Linie), würde ich mag, um alle die Worte, die beginnen mit MAIL_.

Außerdem möchte ich den grep-Befehl auf der shell zu geben, nur die Wörter, die aufeinander abgestimmt sind und nicht die gesamte Zeile (die die gesamte Datei in diesem Fall).

Wie mache ich das?

Habe ich versucht

grep -Gril MAIL_* .
grep -Grio MAIL_* .
grep -Gro MAIL_* .

InformationsquelleAutor AMM | 2010-08-06

grep ubuntu

16

Zunächst mit GNU grep ist installiert, mit Ubuntu-G-flag (verwenden Sie basic-regexp) ist der Standard, so können Sie es weglassen, aber, noch besser, nutzen Sie die erweiterte regexp-mit -E.

-r-flag bedeutet, dass rekursive Suche innerhalb von Dateien eines Verzeichnisses, das ist, was Sie brauchen.

Und, Sie haben Recht, zu benutzen,- o flag print übereinstimmenden Teil der Zeile. Auch, weglassen Dateinamen benötigen Sie ein h-Kennzeichen.

Den einzigen Fehler den Sie gemacht ist, den regulären Ausdruck selbst. Sie verpasste Charakter-Spezifikation vor *. Dein Befehl sollte so Aussehen:
```
grep -Ehro 'MAIL_[^[:space:]]*' .
```
Beispiel-Ausgabe (nicht rekursiv):
```
$ echo "Some garbage MAIL_OPTION comes MAIL_VALUE here" | grep -Eho 'MAIL_[^[:space:]]*'
MAIL_OPTION
MAIL_VALUE
```
- Super..das klappt, aber eine kurze Frage, wie kann ich tun, wenn ich weiß, das MAIL_* Sachen sind entweder als type="MAIL_*" >MAIL_*< in den Dateien? jede Hilfe auf sich?
- Ich verstehe es nicht. Könnten Sie formulieren Ihre Frage? Sie wollen, um zu sehen, die umliegenden Zeichen, um Ihre MAIL_XXX Zeug? Wie, Sie wollen sehen, " und " <> in der Ausgabe von grep-Befehl?
- wenn Ihr MAIL_* könnte enthalten nur alphabetische Zeichen (a-z), dann Sie können ändern, regexp zu 'MAIL_[[:alpha:]]*'
InformationsquelleAutor thor
6

Versuchen Sie den folgenden Befehl
```
grep -Eo 'MAIL_[[:alnum:]_]*'
```
InformationsquelleAutor banx
2
```
grep -o or --only-matching
```
gibt nur den passenden text anstelle von kompletten Linien, aber das problem könnte dein regex ist nicht restriktiv oder gierig genug und eigentlich passt die gesamte Datei.
- nun ist die Art der Worte, die ich will, vorhanden sind, wie diese in der Datei " type="MAIL_ABC_CDE" type="MAIL_XXX_AAA_AAA" etc kann es eine beliebige Anzahl von _'s Was sollten die reg-exp, die ich verwenden sollte? jede Idee, die?
InformationsquelleAutor chocolate_jesus
0

Aus deinem Kommentar zu Thor Antwort, es scheint, Sie wollen auch unterschieden werden, ob der MAIL_.* text ist ein text-Knoten oder Attribut ist, nicht nur zu isolieren, wenn es im XML-Dokument angezeigt. Grep XML kann nicht analysiert werden, Sie brauchen einen richtigen XML-parser für das.

Einer Befehlszeile xml-parser ist xmlstarlet. Es ist verpackt in Ubuntu.

Es an diesem Beispiel wird die Datei Beispiel-Datei:
```
$ cat test.xml 
<some_root>
    <test a="MAIL_as_attribute">will be printed if you want matching attributes</test>
    <bar>MAIL_as_text will be printed if you want matching text nodes</bar>
    <MAIL_will_not_be_printed>abc</MAIL_will_not_be_printed>
</some_root>
```
Für die Auswahl von text Knoten, die Sie verwenden können:
```
$ xmlstarlet sel -t -m '//*' -v 'text()' -n test.xml | grep -Eo 'MAIL_[^[:space:]]*'
MAIL_as_text
```
Und für die Auswahl von Attributen:
```
$ xmlstarlet sel -t -m '//*[@*]' -v '@*' -n test.xml | grep -Eo 'MAIL_[^[:space:]]*'
MAIL_as_attribute
```
Erläuterungen:
- //* ist ein XPath-Ausdruck, der wählt alle Elemente im Dokument und text() Ausgänge den Wert Ihrer Kinder, text-Knoten, daher alles außer text-Knoten wird herausgefiltert
- //*[@*] ist ein XPath-Ausdruck selektiert alle Attribute in das Dokument und dann @* Ausgänge Ihren Wert
InformationsquelleAutor Catalin Iacob

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.