Estoy tratando de sumar ciertos números en una columna usando awk
. Me gustaría sumar solo la columna 3 de los "herreros" para obtener un total de 212. Puedo sumar toda la columna usando awk
pero no solo los "herreros". Yo tengo:
awk 'BEGIN {FS = "|"} ; {sum+=$3} END {print sum}' filename.txt
También estoy usando PuTTY. Gracias por cualquier ayuda.
smiths|Login|2
olivert|Login|10
denniss|Payroll|100
smiths|Time|200
smiths|Logout|10
awk -F '|' '$1 ~ /smiths/ {sum += $3} END {print sum}' inputfilename
-F
flag establece el separador de campo; Lo pongo entre comillas simples porque es un personaje especial de Shell.$1 ~ /smiths/
aplica el siguiente {bloque de código} solo a las líneas donde el primer campo coincide con la expresión regular /smiths/
.Tenga en cuenta que dado que realmente no está usando una expresión regular aquí, solo un valor específico, podría usar con la misma facilidad:
awk -F '|' '$1 == "smiths" {sum += $3} END {print sum}' inputfilename
Que verifica la igualdad de la cadena. Esto es equivalente a usar la expresión regular /^smiths$/
, como se menciona en otra respuesta, que incluye el ^
ancla para que solo coincida con el inicio de la cadena (el inicio del campo 1) y el $
ancla para que solo coincida con el final de la cadena. No estoy seguro de qué tan familiarizado está con las expresiones regulares. Son muy potentes, pero para este caso podría usar una verificación de igualdad de cadena con la misma facilidad.
Otro enfoque es utilizar matrices asociativas awk, más información aquí . Esta línea produce la salida deseada:
awk -F '|' '{a[$1] += $3} END{print a["smiths"]}' filename.txt
Como efecto secundario, la matriz almacena todos los demás valores:
awk -F '|' '{a[$1] += $3} END{for (i in a) print i, a[i]}' filename.txt
Salida:
smiths 212
denniss 100
olivert 10
Muy bien hasta ahora. Todo lo que necesita hacer es agregar un selector antes del bloque para agregar la suma. Aquí comprobamos que el primer argumento contiene solo "herreros":
awk 'BEGIN {FS = "|"} ; $1 ~ /^smiths$/ {sum+=$3} END {print sum}'
Puede acortar esto un poco especificando el separador de campo como una opción. En awk
generalmente es una buena idea inicializar variables en la línea de comando:
awk -F'|' '$1 ~ /^smiths$/ {sum+=$3} END {print sum}'
Personalmente, preferiría mantener la sección awk
lo más simple posible y hacer todo lo posible sin ella. La lógica combinada no aprovecha el poder de las tuberías de Unix y, por lo tanto, es más difícil de entender, depurar o modificar para casos de uso estrechamente relacionados.
cat filename.txt | Perl -pe 's{.*|}{}g' | awk '{sum+=$1} END {print sum}'
cat filename.txt | grep smiths | awk -F '|' '{sum+=$NF} END {print sum}'
-F
opción para especificar el separador.$NF
es para la "última columna".