Drehen Sie multi-line string in einzelne Komma-getrennt

Sagen wir, ich habe folgenden string:

something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)

Wie schalte ich das in einfach

+12.0,+15.5,+9.0,+13.5

in der bash?

Lassen Sie uns Schritt zurück für einen moment und überlegen, diesen thread ein krasses Armutszeugnis für die bash als Programmiersprache. Betrachten Scala listOfStuff mkString ", " oder Haskell ist intercalate ", " listOfString
Verwandte: Konvertieren von text-Datei in eine kommagetrennte Zeichenfolge

InformationsquelleAutor Alex Coplan | 2012-01-03

79

Können Sie awk und sed:
```
awk -vORS=, '{ print $2 }' file.txt | sed 's/,$/\n/'
```
Oder wenn Sie möchten, verwenden Sie ein Rohr:
```
echo "data" | awk -vORS=, '{ print $2 }' | sed 's/,$/\n/'
```
Um es zu brechen:
- awk ist Super im Umgang mit Daten, aufgeschlüsselt nach Bereichen
- -vORS=, setzt den "output record separator" zu ,, was Sie wollte
- { print $2 } sagt awk zu drucken, das zweite Feld für jeden Datensatz (Zeile)
- file.txt ist Ihr mit dem Namen
- sed nur entledigt sich der nachfolgende , und verwandelt es in ein newline (wenn Sie kein newline, die Sie tun können s/,$//)
- awk: ungültige option-v 🙁
- Fügen Sie ein Leerzeichen zwischen -v und ORS=, (für mich auf osx)
- Wie machen Sie den gleichen Befehl für die erste Rohr getrennt? awk -v ORS=| '{ print $1 }' DCMC.rtf | sed 's/,$/\n/' erhalte eine Fehlermeldung
- arbeitete für mich mit { print $1 }
- seltsam, wenn ich versuche, dies zu tun, ist die Ausgabe leer.
InformationsquelleAutor Dan Fego
132

Sauber und einfach:
```
awk '{print $2}' file.txt | paste -s -d, -
```
- Wirkten groß für meine Bedürfnisse. Ich vergaß den Befehl einfügen.
- Dies ist die beste Antwort hier, und offensichtlich der richtige Weg, dies zu tun
- Wie kann ich zitieren, alle Werte mit Einzel - /Doppel-Angebot?
- Sache | awk -F',' '{ print "'\"" $7 "'\' '" }' | paste-s -d ','
InformationsquelleAutor Mattias Ahnberg
12
```
cat data.txt | xargs | sed -e 's//, /g'
```
InformationsquelleAutor Bhargav Srinivasan

$ awk -v ORS=, '{print $2}' data.txt | sed 's/,$//'
+12.0,+15.5,+9.0,+13.5

$ cat data.txt | tr -s ' ' | cut -d ' ' -f 2 | tr '\n' ',' | sed 's/,$//'
+12.0,+15.5,+9.0,+13.5

Servus, was ist, wenn der input awk wurde durch standard-Eingabe (nur stellen function | awk... in deinem Beispiel?
Ich denke, ja.

InformationsquelleAutor kev

8

Diese sollten auch funktionieren
```
awk '{print $2}' file | sed ':a;{N;s/\n/,/};ba'
```
InformationsquelleAutor jaypal singh
7

Könnte dies für Sie arbeiten:
```
cut -d' ' -f5 file | paste -d',' -s
+12.0,+15.5,+9.0,+13.5
```
oder
```
sed '/^.*$+[^ ]*$.*/{s//\1/;H};${x;s/\n/,/g;s/.//p};d' file
+12.0,+15.5,+9.0,+13.5
```
oder
```
sed 's/\S\+\s\+//;s/\s.*//;H;$!d;x;s/.//;s/\n/,/g' file
```
Für jede Zeile in der Datei; hacken aus dem ersten Feld von Leerzeichen nach, schneidet den Rest der Zeile nach dem zweiten Feld und fügen Sie den Frachtraum. Löschen Sie alle Zeilen außer der letzten, wo wir wechseln den Raum und nach dem löschen der eingeführt newline am Anfang, konvertieren alle Zeilenumbrüche zu ,'s.

N. B. geschrieben werden Konnte:
```
sed 's/\S\+\s\+//;s/\s.*//;1h;1!H;$!d;x;s/\n/,/g' file
```
InformationsquelleAutor potong

awk one-liner

$ awk '{printf (NR>1?",":"") $2}' file

+12.0,+15.5,+9.0,+13.5

InformationsquelleAutor Rahul Verma

3

versuchen Sie dies:
```
sedSelectNumbers='s".* $+[0-9]*[.][0-9]*$ .*"\1,"'
sedClearLastComma='s"$.*$,$"\1"'
cat file.txt |sed "$sedSelectNumbers" |tr -d "\n" |sed "$sedClearLastComma"
```
das gute ist, das Teil einfach zu löschen newline "\n" - Zeichen!

EDIT: ein weiterer guter Weg, um die join-Zeilen zu einer Zeile mit sed, ist dies: |sed ':a;N;$!ba;s/\n//g' bekam von hier.
- Das BEARBEITEN ist genial - +1!
InformationsquelleAutor Aquarius Power
3

Können Sie grep:
```
grep -o "+\S\+" in.txt | tr '\n' ','
```
findet die Zeichenfolge beginnend mit +, gefolgt von einer beliebigen Zeichenfolge \S\+, dann konvertieren, neue-Zeile-Zeichen in Anführungszeichen. Dieser sollte ziemlich schnell für große Dateien.

InformationsquelleAutor kenorb

Lösung geschrieben in reines Bash:

#!/bin/bash

sometext="something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)"

a=()
while read -r a1 a2 a3; do
    # we can add some code here to check valid values or modify them
    a+=("${a2}")
done <<< "${sometext}"
# between parenthesis to modify IFS for the current statement only
(IFS=',' ; printf '%s: %s\n' "Result" "${a[*]}")

Ergebnis: +12.0,+15.5,+9.0,+13.5

InformationsquelleAutor Quatro por Quatro

2

Nicht gesehen, diese einfache Lösung mit awk
```
awk 'b{b=b","}{b=b$2}END{print b}' infile
```
InformationsquelleAutor ctac_

Mit perl:

fg@erwin ~ $ perl -ne 'push @l, (split(/\s+/))[1]; END { print join(",", @l) . "\n" }' <<EOF
something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)
EOF

+12.0,+15.5,+9.0,+13.5

InformationsquelleAutor fge

Kann man es auch mit zwei sed-Aufrufe:

$ cat file.txt 
something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)
$ sed 's/^[^:]*: *\([+0-9.]\+\) .*/\1/' file.txt | sed -e :a -e '$!N; s/\n/,/; ta'
+12.0,+15.5,+9.0,+13.5

Erste sed-Aufruf entfernt uninteressante Daten, und der zweite join alle Zeilen.

InformationsquelleAutor

Können Sie auch drucken, wie diese:

Nur awk: mit printf

bash-3.2$ cat sample.log
something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)

bash-3.2$ awk ' { if($2 != "") { if(NR==1) { printf $2 } else { printf "," $2 } } }' sample.log
+12.0,+15.5,+9.0,+13.5

InformationsquelleAutor

0

Anderen Perl-Lösung, ähnlich wie Dan Fego ' s awk:
```
perl -ane 'print "$F[1],"' file.txt | sed 's/,$/\n/'
```
-a sagt perl aufteilen der Eingabezeile in das @F-array, die indiziert, beginnend bei 0.

InformationsquelleAutor Chris Koknat

Sowie der schwierigste Teil ist wahrscheinlich die Auswahl der zweiten "Spalte", da ich nicht weiß, wie man am einfachsten zu behandeln sind mehrere Räume als ein. Für den rest ist es einfach. Verwenden die bash-Substitutionen.

# cat bla.txt
something1:    +12.0   (some unnecessary trailing data (this must go))
something2:    +15.5   (some more unnecessary trailing data)
something4:    +9.0   (some other unnecessary data)
something1:    +13.5  (blah blah blah)

# cat bla.sh
OLDIFS=$IFS
IFS=$'\n'
for i in $(cat bla.txt); do
  i=$(echo "$i" | awk '{print $2}')
  u="${u:+$u, }$i"
done
IFS=$OLDIFS
echo "$u"

# bash ./bla.sh
+12.0, +15.5, +9.0, +13.5

InformationsquelleAutor Marki

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.