Vous êtes sur la page 1sur 27

Bash by Example

Bash con ejemplos.

1. Programación fundamental en la "Bourne again shell" (bash)

Introducción

Te puedes llegar a preguntar por qué deberías aprender programación en Bash. Bueno, aquí hay un par de
razones que te presionan para hacerlo.

Ya la estás corriendo

Si lo chequeas, probablemente encontrarás que ya estás corriendo bash en este momento. Aún si has
cambiado tu "shell" por defecto, bash está probablemente corriendo aún en algún lugar de tu sistema,
porque es la shell de Linux estándar y es usada para una gran variedad de propósitos. Porque bash ya está
corriendo, cualquier número de scripts adicionales que corras serán intrínsecamente eficientes en cuanto al
uso de memoria porque la comparten con algún proceso de bash que ya se encuentra corriendo. ¿Por qué
cargar un intérprete de 500K si ya estás corriendo algo que puede hacer el trabajo, y hacerlo bien?

Ya la estás usando

No sólo ya estás corriendo bash, sino que además estás interectuando con bash diariamente. Siempre está
allí, así que tiene sentido aprender cómo usarla en su máximo potencial. Hacerlo hará tu experiencia con
bash más divertida y productiva. Pero... ¿Por qué deberías aprender programación en bash? Fácil, porque ya
piensas en términos de comandos, copiando archivos, y usando las tuberías y redirrecionando salidas. ¿No
deberías aprender un lenguaje que te permita trabajar y construir a partir de estas poderosas herramientas
que ya sabes utilizar? Las shells dan libertad al potencial de los sistemas UNIX, y bash es la shell de Linux. Es
el "pegamento" de alto nivel entre tú y la máquina. Crece en tu conocimiento sobre bash y automáticamente
incrementarás tu productividad bajo Linux y UNIX -- es así de simple.

Confusión con bash

Aprender bash del modo equivocado puede ser un proceso muy confuso. Muchos usuarios novatos
escriben man bash para ver la página del manual de bash ("man page"), sólo para ser confrontados con una
muy concisa y técnica descripción de la funcionalidad de la shell. Otros intentan con info bash (para ver la
documentación que provee GNU info), causando que la página del manual sea reimpresa o, si tienen suerte,
verán a lo sumo una página de documentación escasamente más amigable.

Aunque esto puede ser algo entristecedor para los novatos, la documentación estándar de bash no puede ser
todas las cosas para toda la gente, y se orienta hacia aquellos ya familiarizados con la programación shell en
general. Hay definitivamente un montón de información técnica excelente en la página del manual ("man
page"), pero su utilidad para los principiantes es limitada.

Allí es donde esta serie entra en el juego. En ella, te mostraré cómo usar las construcciones de bash en
realidad, para que te encuentres preparado para escribir tus propios scripts. En vez de descripciones
técnicas, te proveeré explicaciones en tu idioma, para que sepas no sólo qué es lo que algo hace, sino
además cuándo deberías usarlo. Hacia el final esta serie de tres partes, serás capaz de escribir tus propios
scripts complejos para bash, y de estar al nivel en el que podrás usar bash confortablemente y aumentar tus
conocimientos leyendo (y entendiendo!) la documentación estándar de bash. Comencemos.

Variables de entorno

Bajo bash y bajo casi cualquier shell, el usuario puede definir variables de entorno, que son guardadas
internamente como cadenas de caracteres ASCII. Una de las cosas más prácticas acerca de las variables de
entorno es que son una parte estándar del modelo de proceso de UNIX. Esto significa que las variables de
entorno no son exclusivas de los scripts de shell, sino que pueden ser usadas por programas compilados de
manera estándar también. Cuando "exportamos" una variable de entorno bajo bash, cualquier programa
subsecuente que corramos podrá leer lo que le asignamos, sea un script de shell o no. Un buen ejemplo es el
comando vipw, que normalmente permite al superusuario root editar el archivo con la clave ("password") del
sistema. Ajustando la variable de entorno EDITOR con el nombre de tu editor de texto favorito, puedes
configurar a vipw para que lo use en lugar de vi, algo bastante práctico si estás acostumbrado a xemacs y
realmente no te gusta vi.

La manera estándar de definir una variable de entorno bajo bash es:

Listado de Código 1.1: Definir una variable de entorno


$ myvar='This is my environment variable!'
El comando de arriba definió una variable de entorno llamada "myvar" que contiene la cadena "This is my
environment variable!". Hay algunas cosas a las que es necesario prestarle atención en lo anterior: primero,
no hay ningún espacio rodeando al signo "="; cualquier espacio allí resultaría en un error (pruébalo y
confírmalo). La segunda cosa a tener en cuenta es que, aunque pudimos haber omitido las comillas si se
tratase de una sola palabra, son necesarias cuando el valor de la variable de entorno es más de una palabra
(contiene espacios o tabs).

Nota: Para información extremadamente detallada sobre cómo deben ser usadas las comillas en
bash, es probable que la sección "QUOTING" de la "man page" de bash te resulte útil. La existencia
de secuencias especiales de caracteres que son "expandidas" (reemplazadas) por otros valores
complica el modo en que las cadenas son manejadas en bash. Sólo cubriremos las funciones más
usadas/importantes de las comillas en esta serie.

En tercer lugar, mientras que normalmente podemos usar comillas dobles en vez de comillas simples,
hacerlo en el ejemplo anterior hubiera causado un error. ¿Por qué? Porque el usar comillas simples desactiva
una de las características de bash llamada "expansión", donde caracteres y secuencias de caracteres
especiales son reemplazados por valores. Por ejemplo, el caracter "!" es el caracter de expansión del historial,
que bash normalmente reemplaza por un comando previamente escrito. (No cubriremos la expansión del
historial en esta serie de artículos, porque no es usada frecuentemente en la programación en bash. Para
más información sobre eso, mira la sección "HISTORY EXPANSION" en la página del manual ("man page") de
bash.) Aunque este comportamiento al estilo "macro" puede ser muy práctico, en esta ocasión queremos un
signo de exclamación literal al final del valor de nuestra variable de entorno, en vez de un "macro".

Ahora, echémosle una mirada a cómo uno usa en realidad una variable de entorno. Aquí hay un ejemplo:
Listado de Código 1.2: Usar variables de entorno
$ echo $myvar
This is my environment variable!
Precediendo el nombre de nuestra variable de entorno con un $, podemos hacer que bash la reemplace por
el valor de myvar. En la terminología de bash, esto se llama "expansión de variable" ("variable expansion").
Pero, si probamos lo siguiente:

Listado de Código 1.3: Primer intento de uso de expansión de una


variable
$ echo foo$myvarbar
foo
Queríamos que esto imprima "fooThis is my environment variable!bar", pero no funcionó. ¿Cuál fue el error?
En pocas palabras, la facilidad de expansión de variable de bash se encontró confundida. No pudo dilucidar si
queríamos expandir la variable $m, $my, $myvar, $myvarbar, etc. ¿Cómo podemos ser más explícitos y
claramente decirle a bash a qué variables nos estamos refiriendo? Intenta esto:

Listado de Código 1.4: Expansión de variable; segundo intento.


$ echo foo${myvar}bar
fooThis is my environment variable!bar
Como puedes ver, podemos encuadrar el nombre de nuestra variable de entorno entre llaves cuando no se
encuentra claramente separada del texto que la rodea. Mientras que $myvar es más rápido de escribir y
funcionará en la mayoría de las ocasiones, ${myvar} puede ser comprendida correctamente en casi cualquier
situación. Más allá de eso, ambas hacen lo mismo, y verás ambas formas de expansión de variable en el resto
de la serie. Querrás recordar que tienes que usar la forma más explícita (con las llaves) cuando tu variable de
entorno no se encuentre aislada del texto que la rodea mediante algún espacio en blanco (espacio o tabs).

Recuerda que también mencionamos que podemos "exportar" variables. Cuando exportamos una variable de
entorno, esta se encuentra automáticamente disponible en el entorno de cualquier script o ejecutable que se
corra subsecuentemente. Los scripts de shell pueden acceder a la variable de entorno usando el soporte que
brinda bash intrínsecamente, mientras que los programas en C pueden usar la función getenv(). Aquí hay un
código en C de ejemplo que deberías escribir y compilar -- nos permitirá entender las variables de entorno
desde la perspectiva de C:

Listado de Código 1.5: myvar.c -- un programa en C de ejemplo para


las variables de entorno
#include <stdio.h>
#include <stdlib.h>

int main(void) {
char *myenvvar=getenv("EDITOR");
printf("The editor environment variable is set to %s\n",myenvvar);
}
Guarda el código anterior en un archivo llamado myenv.c, y luego compílalo usando el siguiente comando:

Listado de Código 1.6: Compilar el código de arriba


$ gcc myenv.c -o myenv
Ahora habrá un programa ejecutable en tu directorio que, al ser corrido, imprimirá el valor de la variable de
entorno EDITOR, si es que lo tiene. Esto es lo que pasa cuando lo corro en mi máquina:

Listado de Código 1.7: Correr el programa de arriba


$ ./myenv
The editor environment variable is set to (null)
Hmmm... Como la variable de entorno EDITOR no poseía ningún valor, el programa en C recibe una cadena
nula. Intentemos nuevamente dándole un valor específico:

Listado de Código 1.8: Probar con un valor específico


$ EDITOR=xemacs
$ ./myenv
The editor environment variable is set to (null)
Aunque pudiste haber esperado que myenv imprima el valor "xemacs", no funcionó, porque no exportamos
la variable de entorno EDITOR. Esta vez lo haremos funcionar:

Listado de Código 1.9: Mismo programa luego de exportar la variable


$ export EDITOR
$ ./myenv
The editor environment variable is set to xemacs
Así, has visto con tus propios ojos que otro proceso (en este caso nuestro programa en C) no puede ver la
variable de entorno hasta que esta es exportada. Incidentalmente, si tú quieres, puedes definir y exportar
una variable de entorno usando una sola línea, del siguiente modo:

Listado de Código 1.10: Definir y exportar una variable de entorno en


un solo comando
$ export EDITOR=xemacs
Funciona idénticamente a la versión de dos líneas. Este sería un buen momento para enseñar cómo borrar
una variable de entorno usando unset:

Listado de Código 1.11: Borrar una variable de entorno


$ unset EDITOR
$ ./myenv
The editor environment variable is set to (null)
Vistazo a los cortes de cadenas

Cortar cadenas -- esto es, separar una cadena original en más pequeños y separados trozos -- es una de esas
tareas que es llevada a cabo diariamente por tu script de shell tipo. Muchas veces, los scripts de shell
necesitan tomar una ruta completa, y encontrar el archivo o directorio final. Aunque es posible (y divertido!)
programar esto en bash, el ejecutable estándar de UNIX basename hace esto extremadamente bien:

Listado de Código 1.12: Usar basename


$ basename /usr/local/share/doc/foo/foo.txt
foo.txt
$ basename /usr/home/drobbins
drobbins
basename es una muy práctica herramienta para cortar cadenas. Su acompañante, llamado dirname,
devuelve la "otra" parte de la ruta que basename desecha:

Listado de Código 1.13: Usar dirname


$ dirname /usr/local/share/doc/foo/foo.txt
/usr/local/share/doc/foo
$ dirname /usr/home/drobbins/
/usr/home
Nota: Ambos dirname y basename no miran ningún archivo ni directorio en el disco; son
puramente comandos de manipulación de cadenas.

Sustitución de comandos

Una cosa bastante práctica de saber es cómo crear una variable de entorno que contenga el resultado de un
comando ejecutable. Esto es muy fácil de hacer:
Listado de Código 1.14: Crear una variable de entorno con el resultado
de un comando
$ MYDIR=`dirname /usr/local/share/doc/foo/foo.txt`
$ echo $MYDIR
/usr/local/share/doc/foo
Lo que hicimos arriba se llama sustitución de comando ("command substitution"). Varias cosas merecen ser
notadas en este ejemplo. En la primera línea, simplemente encuadramos el comando que queríamos ejecutar
entre esas comillas especiales. Esas comillas no son las comillas simples estándar, sino que son las que se
imprimen al oprimir una de las teclas del teclado que normalmente se encuentra por encima de la tecla Tab.
Podemos hacer exactamente lo mismo con la sintaxis alternativa para la sustitución de comandos de bash:

Listado de Código 1.15: Sintaxis alternativa para la sustitución de


comandos
$ MYDIR=$(dirname /usr/local/share/doc/foo/foo.txt)
$ echo $MYDIR
/usr/local/share/doc/foo
Como puedes ver, bash provee múltiples maneras de realizar exactamentela misma cosa. Usando la
sustitución de comandos, podemos ubicar cualquier comando o tuberías con comandos entre ` ` o $( ) y
asignar su resultado a una variable de entorno. ¡Qué cosa práctica! Aquí hay un ejemplo de cómo usar
tuberías con la sustitución de comandos:

Listado de Código 1.16: Tuberías y sustitución de comandos


$ MYFILES=$(ls /etc | grep pa)
$ echo $MYFILES
pam.d passwd
Cortando cadenas como un profesional

Si bien basename y dirname son herramientas grandiosas, hay momentos en los que podemos necesitar
realizar operaciones de corte de cadenas de una manera más avanzada que sólo manipulaciones estándar
con las rutas. En esos casos, podemos aprovechar la característica intrínseca avanzada de bash de expansión
de variable. Ya hemos usado la manera estándar de expansión de variable, que se ve como esto: ${MYVAR}.
Pero bash puede también realizar cortes de cadenas prácticos por sí mismo. Échale una mirada a estos
ejemplos:

Listado de Código 1.17: Ejemplos de corte de cadenas


$ MYVAR=foodforthought.jpg
$ echo ${MYVAR##*fo}
rthought.jpg
$ echo ${MYVAR#*fo}
odforthought.jpg
En el primer ejemplo, escribimos ${MYVAR##*fo}. ¿Qué significa esto exactamente? Básicamente, dentro de $
{ }, escribimos el nombre de la variable de entorno, dos ##s, y una "wildcard" (comodín, representación de
caracteres o cadenas de caracteres no explicitados), "*fo". Luego, bash tomó MYVAR, encontró la más larga
sub-cadena desde el comienzo de la cadena "foodforthought.jpg" que encajaba con la "wildcard" "*fo", y
realizó el corte desde el comienzo de la cadena principal. Esto es un poco difícil de asimilar a la primera, así
que para entender cómo funciona esta opción especial de "##", sigamos los pasos que realizó bash para
completar esta expansión. Primero, comenzó buscando las sub-cadenas desde el principio de
"foodforthought.jpg" que encajaran con la "wildcard" "*fo". Aquí están las sub-cadenas que chequeó:

Listado de Código 1.18: Sub-cadenas siendo chequeadas


f
fo MATCHES *fo
foo
food
foodf
foodfo MATCHES *fo
foodfor
foodfort
foodforth
foodfortho
foodforthou
foodforthoug
foodforthought
foodforthought.j
foodforthought.jp
foodforthought.jpg
Luego de buscar sub-cadenas que encajaran (puedes ver que bash encontró dos) seleccionó la más larga, la
eliminó del inicio de la cadena original, y devolvió el resultado.

La segunda forma de expansión de variable mostrada arriba es casi idéntica a la primera, excepto que usa
sólo un "#" -- y bash realiza un proceso muy muy similar. Chequea las mismas sub-cadenas que chequeó en
nuestro primer ejemplo, sólo que bash ahora quita la más corta de nuestra cadena original, y devuelve el
resultado. Entonces, tan pronto como determina que la subcadena "fo" es lo que buscaba, elimina "fo" de
nuestra cadena y devuelve "odforthought.jpg".

Esto puede parecer extremadamente críptico, así que te mostraré una manera fácil de recordar estas
herramientas. Cuando buscamos la sub-cadena más larga, usamos ## (porque ## es más largo que #).
Cuando buscamos la más corta, usamos #. ¿Ves? ¡No es tan difícil de recordar! Espera. ¿Cómo recordamos
que debemos usar el caracter '#' para eliminar desde el "principio" de una cadena? ¡Simple! Notarás que en
un teclado americano, shift-4 es "$", que es el caracter de expansión de variable de bash. En el teclado,
inmediatamente a la izquierda de "$" está "#". Entonces, puedes ver que "#" está "al principio" de "$", y así
(de acuerdo a nuestra regla mnemotécnica), "#" elimina caracteres desde el principio de la cadena. Te puedes
llegar a preguntar cómo eliminamos caracteres ubicados al final de la cadena. Si adivinaste que usamos el
caracter inmediatamente a la derecha de "$" en el teclado americano ("%"), estás en lo cierto! Aquí hay
algunos ejemplos rápidos sobre cómo cortar porciones finales de cadenas:

Listado de Código 1.19:


$ MYFOO="chickensoup.tar.gz"
$ echo ${MYFOO%%.*}
chickensoup
$ echo ${MYFOO%.*}
chickensoup.tar
Como puedes ver, las opciones de expansión de variable % y %% funcionan del mismo modo que # y ##,
excepto que eliminan la "wildcard" del final de la cadena. Nota que no estás obligado a usar el caracter "*" si
quieres eliminar una sub-cadena específica del final:

Listado de Código 1.20: Cortar sub-cadenas del final


MYFOOD="chickensoup"
$ echo ${MYFOOD%%soup}
chicken
En este ejemplo, no importa si usas "%%" o "%", ya que sólo una sub-cadena puede encajar. Y recuerda, si te
olvidas si debes usar "#" o "%", mira las teclas 3, 4, y 5 en tu teclado y te darás cuenta.

Podemos usar otra forma de expansión de variable para seleccionar una sub-cadena específica, basándonos
en un punto de inicio y una longitud. Intenta escribir las siguienes líneas en bash:

Listado de Código 1.21: Seleccionar una sub-cadena específica


$ EXCLAIM=cowabunga
$ echo ${EXCLAIM:0:3}
cow
$ echo ${EXCLAIM:3:7}
abunga
Esta forma de corte de cadena puede sernos muy útil; simplemente especifica el caracter a partir del cual
iniciar y la longitud de la sub-cadena, todo separado por dos puntos.

Poniendo en práctica el corte de cadenas

Ahora que hemos aprendido todo acerca del corte de cadenas, escribamos un pequeño y simple script de
shell. Nuestro script aceptará un sólo archivo como argumento, e imprimirá si parece ser un "tarball" o no.
Para determinar si se trata de un "tarball", se fijará en el patrón ".tar" al final del archivo. Aquí está:

Listado de Código 1.22: mytar.sh -- un script de ejemplo


#!/bin/bash

if [ "${1##*.}" = "tar" ]
then
echo This appears to be a tarball.
else
echo At first glance, this does not appear to be a tarball.
fi
Para correr este script, transcríbelo dentro a un archivo llamado mytar.sh, y luego escribe chmod 755
mytar.sh para hacerlo ejecutable. Luego, pruébalo con un "tarball" del siguiente modo:

Listado de Código 1.23: Probar el script


$ ./mytar.sh thisfile.tar
This appears to be a tarball.
$ ./mytar.sh thatfile.gz
At first glance, this does not appear to be a tarball.
OK, funciona, pero no es muy funcional. Antes de que lo hagamos más útil, echémosle una mirada a la
construcción "if" usada arriba. En ella, tenemos una expresión booleana. En bash, el operador de
comparación "=" chequea la igualdad de cadenas. En bash, todas las expresiones booleanas son encuadradas
en corchetes. ¿Pero qué es lo que la expresión booleana prueba en realidad? Echémosle una mirada a la
parte izquierda. De acuerdo con lo que hemos aprendido sobre corte de cadenas, "${1##*.}" eliminará la
sub-cadena más larga que encaje con "*." del principio de nuestra cadena contenida en la variable de
entorno "1", devolviendo el resultado. Esto causará que se devuelva todo lo escrito luego del último ".".
Obviamente, si el archivo termina en ".tar", tendremos "tar" como resultado, y la condición se cumplirá.

Te puedes estar preguntando qué representa la variable de entorno "1". Muy simple -- $1 es el primer
argumento recibido por el script desde la línea de comandos, $2 es el segundo, etc. OK, ahora que hemos
repasado la función, podemos echar una primera mirada a las instrucciones "if".

Instrucciones "if"

Como la mayoría de los lenguajes, bash tiene su propia implementación de condicionales. Cuando la uses,
ajústate al formato de arriba; esto es, mantén el "if" y el "then" en líneas separadas, y procura que el "else" y
el "fi" final (y requerido) estén alineados horizontalmente con los primeros. Esto hace que el código sea más
fácil de entender y posibilita encontrar los errores más rápidamente. Además de la forma de "if,else", hay
algunas otras formas de instrucciones "if":
Listado de Código 1.24: Forma básica de la instrucción if
if [ condition ]
then
action
fi
Esta realiza una acción sólo si la condición es verdadera; caso contrario, no realiza ninguna acción y continúa
ejecutando cualquier línea luego del "fi".

Listado de Código 1.25: Chequear condiciones antes de seguir


después del fi
if [ condition ]
then
action
elif [ condition2 ]
then
action2
.
.
.
elif [ condition3 ]
then

else
actionx
fi
La forma "elif" de arriba probará consecutivamente cada condición y ejecutará la acción correspondiente a la
primera condición verdadera. Si ninguna de las condiciones es verdadera, ejecutará la acción del "else", si la
hay, y luego continuará ejecutando las líneas que sigan a la instrucción entera de"if,elif,else".

La próxima vez

Ahora que hemos cubierto lo más básico de bash, es tiempo de poner manos a la obra y escribir algunos
scripts reales. En el próximo artículo, cubriré las construcciones de bucles (iteraciones), funciones,
"namespace" (ámbito de variables), y otros temas esenciales. Luego, estaremos listos para escribir algunos
scripts más complicados. En el tercer artículo, nos enfocaremos casi exclusivamente en scripts y funciones
más complejos, como también en varias opciones de diseño de scripts en bash. Nos vemos en el siguiente!
Bash by example

Bash con ejemplos, parte 2

1. Más fundamentos de programación en bash

Argumentos

Empezaremos con unas nociones básicas sobre el manejo de argumentos en la línea de comandos, para
luego pasar a algunos esquemas básicos de bash.

En el programa de ejemplo en el artículo introductorio, usamos la variable de entorno "$1", que se refería al
primer argumento suministrado en la línea de comandos. Podemos usar "$2", "$3", etc. para referirnos al
segundo y tercer argumentos, respectivamente, y así de forma sucesiva. Aquí tenemos un ejemplo:

Listado de Código 1.1: Referente a los argumentos pasados al guión:


#!/usr/bin/env bash

echo el nombre del guión es $0


echo el primer argumento es $1
echo el segundo argumento es $2
echo el decimoséptimo argumento es $17
echo el número de argumentos es $#
El ejemplo es autoexplicativo, excepto por dos detalles. Primero: "$0" se expande al nombre del propio guión,
tal y como se ha llamado en la línea de comandos; y, segundo: "$#" se expande al número de argumentos
pasados al guión. Juega un poco con el guión anterior, pasándole distintos tipos de argumentos para
familiarizarte con su manera de funcionar.

A veces resulta útil poder referenciar todos los argumentos en un solo bloque desde el guión. Para este
propósito bash nos ofrece la variable de entorno "$@", que se expande a todos los parámetros
suministrados, concatenados y separados por espacios en blanco. Veremos un ejemplo de su uso al estudiar
los bucles, más adelante en este mismo artículo.

Esquemas de programación en bash

Si alguna vez has programado en un lenguaje procedimental como C, Pascal, Python, or Perl, estarás
familiarizado con los esquemas estándares de la programación, como las sentencias "if", los bucles "for" y
algunos más. Bash tiene sus propias versiones de los mismos. En las próximas secciones introduciré algunos
esquemas de bash y explicaré las diferencias entre estos esquemas y otros similares con los que puede que
te hayas encontrado al usar otros lenguajes de programación. Si no has programado demasiado antes, no te
preocupes. Hay ejemplos e información suficientes para que puedas seguir el texto.
Amor condicional

Si alguna vez has programado algo, relacionado con archivos, en C, sabrás que se requiere un esfuerzo
significativo para saber si un fichero dado es más nuevo que otro. Eso es porque C no tiene una sintaxis
interna para realizar dicha comparación; en lugar de eso dos llamadas a stat() y dos estructuras stat son
necesarias para poder realizar dicha comparación "a mano". En contraste, bash puede realizar esta operación
mediante operadores estándar que posee. Por eso, determinar si "/tmp/miarchivo es legible" es tan
sencillo como comprobar si "$mivar es mayor que cuatro".

La lista siguiente muestra los operadores de comparación más frecuentemente usados en bash. También
encontrarás un ejemplo de como usar cada opción de forma correcta. El ejemplo podría usarse
inmediatamente después del "if":

Listado de Código 1.2: Operadores de comparación en bash


if [ -z "$mivar" ]
then
echo "mivar no está definida"
fi
A veces hay varias formas de realizar una misma comparación, los siguientes ejemplos funcionan de forma
idéntica:

Listado de Código 1.3: Dos formas de hacer una comparación


if [ "$mivar" -eq 3 ]
then
echo "mivar igual a 3"
fi

if [ "$mivar" = "3" ]
then
echo "mivar igual a 3"
fi
En el ejemplo de arriba, ambas comparaciones hacen lo mismo, pero, mientras que la primera una un
operador de comparación aritmético, la segunda usa un operador de comparación de cadenas de texto.

Peculiaridades de la comparación de cadenas

Si bien la mayoría de las veces se pueden omitir las comillas dobles alrededor de las cadenas y las variables
que las contienen, no se considera una buena práctica de programación. ¿Por qué? Todo funcionará
perfectamente mientras la variable no contenga un espacio o un carácter de tabulación. En ese caso bash se
confundirá. Aquí hay un ejemplo de comparación que fallará por este motivo:

Listado de Código 1.4: Ejemplo de comparación defectuosa


if [ $mivar = "foo bar oni" ]
then
echo "si"
fi
En el ejemplo de arriba, la condición se cumplirá tan solo si $mivar contiene la cadena "foo". Si contuviera
una cadena con espacios, como "foo var oni", el guión fallará con este error:

Listado de Código 1.5: Error cuando la variable contiene espacios


[: too many arguments
En este caso, los espacios en "$mivar" (que contiene "foo var oni") confunden al intérprete bash. Tras
expandir "$mivar", la comparación queda de esta forma:
Listado de Código 1.6: Comparación final
[ foo bar oni = "foo bar oni" ]
Si la variable de entorno no se ha puesto entre comillas dobles, bash piensa que se han colocado más
argumentos de la cuenta entre los corchetes. La solución obvia a este problema pasa por encerrar el
argumento entre comillas dobles. Recuerda: si tomas el buen hábito de poner siempre tus variables entre
comillas dobles, eliminarás de raíz muchos errores similares de programación. Así es como esta comparación
debería haberse escrito:

Listado de Código 1.7: Forma correcta de escribir comparaciones


if [ "$mivar" = "foo bar oni" ]
then
echo "si"
fi
Este código funcionará como se espera, sin sorpresas desagradables.

Nota: Si quieres que tus variables de entorno se expandan, debes usar comillas dobles. Recuerda
que las comillas simples desactivan la expansión de variables y del historial.

Esquemas de bucle: "for"

Ahora que hemos comentado las sentencias de bifurcación condicional "if" empezaremos con los bucles. El
bucle "for" estándar. Aquí hay un ejemplo básico:

Listado de Código 1.8: Ejemplo básico de for


#!/usr/bin/env bash

for x in uno dos tres cuatro


do
echo número $x
done

Salida:
número uno
número dos
número tres
número cuatro
¿Qué ha pasado exactamente? La parte "for x" del bucle define una variable que llamaremos variable de
control del bucle, que se llama "$x", y a la cual se le asignan de forma sucesiva los valores "uno", "dos", "tres"
y "cuatro". Tras cada asignación, el cuerpo del bucle (la parte entre "do" y "done") se ejecuta una vez. En el
cuerpo nos referimos a la variable de control del bucle "$x" usando la sintaxis estándar de bash para la
expansión de variables, como se haría con cualquier otra variable de entorno. For siempre acepta una lista de
palabras tras "in". En este caso hemos usado cuatro palabras en castellano, pero la lista de palabras puede
contener también nombres de archivo e incluso comodines. El siguiente ejemplo ilustra como usar los
comodines estándar de bash en un bucle for:

Listado de Código 1.9: Usando comodines estándar del intérprete


#!/usr/bin/env bash

for miarchivo in /etc/r*


do
if [ -d "$miarchivo" ]
then
echo "$miarchivo (dir)"
else
echo "$miarchivo"
fi
done

salida:

/etc/rc.d (dir)
/etc/resolv.conf
/etc/resolv.conf~
/etc/rpc
Este código itera sobre cada archivo en /etc que empiece con una "r". Para ello, bash, primero expande el
comodín en /etc/r*, reemplazando esa ruta con la
cadena /etc/rc.d /etc/resolv.conf /etc/resolv.conf~ /etc/rpc antes de iterar. Una vez dentro
del bucle, el operador condicional "-d" se usa en dos líneas que hacen dos cosas distintas, dependiendo de si
"miarchivo" es un directorio o no. Si lo es, entonces la cadena " (dir)" se añade al final de la línea.

Podemos usar múltiples comodines o incluso variables de entorno en la lista de palabras:

Listado de Código 1.10: Comodines múltiples y variables de entorno


for x in /etc/r??? /var/lo* /home/drobbins/mystuff/* /tmp/${MYPATH}/*
do
cp $x /mnt/mydira
done
Bash ejecutará todas las expansiones de comodines y de variables que sean posibles, creando
-potencialmente- una muy larga lista de palabras.

Si bien todos los ejemplos de expansión de comodines se han realizado con rutas absolutas, también se
pueden usar rutas relativas, como estas:

Listado de Código 1.11: Usando rutas relativas


for x in ../* miscosas/*
do
echo $x es un fichero inútil
done
En el anterior ejemplo, bash expande los comodines en relación al directorio actual. Tal y como se usarían
rutas relativas en la línea de comandos. Juega un poco con la expansión de comodines. Ten en cuenta que, si
usas rutas absolutas con tus comodines, bash expandirá el comodín a una lista de rutas absolutas. De
cualquier otra forma, bash usará rutas relativas en la lista de palabras resultante de la expansión. Si solo
quieres referirte a los archivos en el directorio activo (por ejemplo, cuando escribas for x in *), la lista
resultante no tendrá ningún tipo de prefijo de ruta añadido. Recuerda que la información de ruta precedente
se podría eliminar, de todas formas, con basename, tal y como en este ejemplo:

Listado de Código 1.12: Recortar ruta antepuesta a un nombre de


archivo
for x in /var/log/*
do
echo `basename $x` es un fichero contenido en /var/log
done
Muchas veces puede ser útil realizar bucles que operen sobre los parámetros suministrados en la línea de
comandos. El siguiente es un ejemplo sobre como usar la variable "$@", que se introdujo al principio de este
mismo artículo:

Listado de Código 1.13: Ejemplo de uso de la variable $@


#!/usr/bin/env bash

for cosa in "$@"


do
echo has escrito ${cosa}.
done

salida:

$ allargs hola a todos


has escrito hola
has escrito a
has escrito todos

Aritmética del intérprete

Antes de aprender un segundo tipo de esquema de bucle, es una buena idea aprender algo sobre la
aritmética de bash. Si, es cierto, bash puede realizar operaciones simples con enteros. Tan solo es necesario
encerrar la operación entre estos dos pares: "$((" y "))", y bash evaluará la expresión. Aquí hay algunos
ejemplos:

Listado de Código 1.14: Contando en bash


$ echo $(( 100 / 3 ))
33
$ mivar="56"
$ echo $(( $mivar + 12 ))
68
$ echo $(( $mivar - $mivar ))
0
$ mivar=$(( $mivar + 1 ))
$ echo $mivar
57
Ahora que ya estás familiarizado con las operaciones matemáticas, es el momento de presentar dos nuevos
esquemas iterativos: "while" y "until".

Más esquemas iterativos: "while" y "until"

Una sentencia "while" se ejecutará iterativamente mientras una condición dada sea cierta, y tiene el siguiente
formato:

Listado de Código 1.15: Modelo de sentencia while


while [ condición ]
do
comandos
done
Las sentencias "while" se pueden usar típicamente para ejecutar una tarea un número dado de veces, como
en el ejemplo siguiente:

Listado de Código 1.16: Repetir la sentencia 10 veces


mivar=0
while [ $mivar -ne 10 ]
do
echo $mivar
mivar=$(( $mivar + 1 ))
done
Como puedes ver, usamos las expansiones matemáticas de bash para asegurarnos de que, eventualmente, la
condición se rompa, y así también el bucle.
Las sentencias "until" nos proveen con la funcionalidad inversa de "while". Repiten el bucle mientras la
condición sea falsa, aquí hay un bucle "until" que funciona de forma idéntica al ejemplo "while" anterior:

Listado de Código 1.17: Ejemplo de bucle until


mivar=0
until [ $mivar -eq 10 ]
do
echo $mivar
mivar=$(( $mivar + 1 ))
done

Sentencias case

Las sentencias case "Case" son esquemas condicionales, un ejemplo:

Listado de Código 1.18: Ejemplo de código usando case


case "${x##*.}" in
gz)
gzunpack ${SROOT}/${x}
;;
bz2)
bz2unpack ${SROOT}/${x}
;;
*)
echo "formato de archivo no reconocido."
exit
;;
esac
En este ejemplo, bash expande "${x##*.}". En el programa, "$x" es el nombre de un archivo, y "${x##*.}"
tiene el efecto de recortar todo el texto excepto el que vaya tras el último punto en el nombre del archivo.
Tras eso bash compara lo que queda con los valores listados en los apartados marcados con ")". El resultado
de "${x##*.}" se compara por tanto con "gz", luego "bz2" y finalmente "*". Si "${x##*.}" coincide con alguno
de dichos patrones o cadenas, las líneas tras el paréntesis ")" se ejecutan, hasta los dos punto y coma
siguientes. En ese punto, bash continúa ejecutando las líneas que haya tras la palabra de cierre "esac". Si
ningún patrón o cadena coincide, ninguna línea de código dentro de case se ejecuta. No obstante, en este
caso concreto, al menos una línea será ejecutada, debido al uso de un comodín "*" como una de las
posibilidades, que coincidirá con todo lo que no coincidan "gz" o "bz2".

Funciones y contexto

En bash, puedes definir funciones, de forma similar a como se definen en los lenguajes procedimentales
como Pascal, C y otros. Dichas funciones pueden aceptar argumentos de forma similar a como los aceptan
los guiones. Aquí tenemos una definición de función de ejemplo:

Listado de Código 1.19: Ejemplo de definición de función


tarview() {
echo -n "Mostrando contenido de $1 "
if [ ${1##*.} = tar ]
then
echo "(tar descomprimido)"
tar tvf $1
elif [ ${1##*.} = gz ]
then
echo "(tar comprimido con gzip)"
tar tzvf $1
elif [ ${1##*.} = bz2 ]
then
echo "(tar comprimido con bzip2)"
cat $1 | bzip2 -d | tar tvf -
fi
}
Nota: Este mismo ejemplo de arriba podría escribirse usando una sentencia "case". ¿Podrías tú
decirnos como?
Arriba definimos una función llamada "tarview" que acepta un argumento, un tarball de alguna clase. Cuando
la función se ejecuta, identifica el tipo de tarball al que el argumento apunta, (si es un tarball descomprimido,
o comprimido con bzip2 o gzip), imprime una línea informativa, y muestra el contenido del tarball. Así es
como debemos llamar a esta función (da igual que sea desde un guión o desde la misma línea de comandos,
tras ser escrita en el mismo intérprete, pegada, o volcada usando source.

Listado de Código 1.20: Llamando a la función de arriba


$ tarview shorten.tar.gz
Displaying contents of shorten.tar.gz (gzip-compressed tar)
drwxr-xr-x ajr/abbot 0 1999-02-27 16:17 shorten-2.3a/
-rw-r--r-- ajr/abbot 1143 1997-09-04 04:06 shorten-2.3a/Makefile
-rw-r--r-- ajr/abbot 1199 1996-02-04 12:24 shorten-2.3a/INSTALL
-rw-r--r-- ajr/abbot 839 1996-05-29 00:19 shorten-2.3a/LICENSE
....
Como puedes ver, los argumentos usan el mismo mecanismo de referenciación dentro de la función que los
usados en un guión para referenciar a los argumentos de línea de comandos. La macro "$#" se expande
también al número de argumentos. La única cosa que puede no funcionar completamente como se espera es
la variable "$0", que, o bien se expande a la cadena "bash" (si la función se llamó desde la línea de comandos,
de forma interactiva, o bien al nombre del guión que la llamó.

Nota: Úsalas de forma interactiva: No olvides que las funciones, como la de arriba, pueden ser
incluídas en tu ~/.bashrc o tu ~/.bash_profile para que estén disponibles siempre que estés usando
bash.

Visibilidad de las variables

A menudo necesitarás crear variables de entorno dentro de una función. Si bien es posible, hay algo que
deberías saber. En la mayoría de lenguajes compilados (como C), cuando se crea una variable dentro de una
función, ésta es colocada en un contexto separado. Si en C defines una función llamada mifunción, y dentro
defines una variable "x", ninguna otra variable "x" definida en una función diferente se verá afectada,
eliminando efectos colaterales.

Ésto, que es completamente cierto en C, no lo es en bash. En bash, cuando creas una variable de entorno en
cualquier lugar dentro de una función, se añade al contexto global. Esto significa que siempre se corre el
peligro de sobreescribir otra variable, y que la variable trascenderá al lapso de vida de la función:

Listado de Código 1.21: Tratamiento de variables en bash


#!/usr/bin/env bash

mivar="hola"

mifunc() {

mivar="un dos tres"


for x in $mivar
do
echo $x
done
}

mifunc

echo $mivar $x
Cuando este guión se ejecuta, produce la salida "un dos tres tres", mostrando como la variable "$mivar"
definida en la función ha sobreescrito a la global "$mivar", y como la variable de control "$x" continúa
existiendo incluso tras salir de la función en la que fue definida, y a su vez sobreescribiendo cualquier otra
posible "$x" que estuviesa ya definida.

En este simple ejemplo, el error es fácil de ver y se puede compensar tan solo cambiando los nombres de las
variables. Sin embargo, la mejor forma de acometer el problema pasa por prevenir la posibilidad de que
ninguna variable pueda sobreescribir a una definida de forma global, mediante el uso del comando "local".
Cuando se usa el comando "local" para crear variables dentro de una función, las mismas se mantendrán en
un entorno local a la función, y no interferirán con ninguna otra variable global. A continuación, un ejemplo
de como implementar dicha definición, para que ninguna variable global sea sobreescrita:

Listado de Código 1.22: Asegurándose de no sobreescribir variables


globales
#!/usr/bin/env bash

mivar="hola"

mifunc() {
local x
local mivar="un dos tres"
for x in $mivar
do
echo $x
done
}

mifunc

echo $mivar $x
Esta función producirá como resultado "hola" -- la "$mivar" global no se sobreescribe, y "$x" no existirá fuera
de mifunc. En la primera línea de la función creamos "$x", una variable local que se usa después, mientras en
la segunda línea (local mivar="one two three") creamos otra "$mivar", y le asignamos un valor. La primera
forma es ideal para las variables de control de bucles, ya que no podemos hacerlo directamente en la forma
"for local x in $mivar". Esta función no sobreescribe ninguna variable anterior. Se recomienda diseñar de esta
forma todas las funciones, tan solo se deberá omitir la declaración local de las variables cuando se pretenda,
de forma consciente, escribir en una variable global.

Resumiendo

Ahora que hemos cubierto lo más esencial de la funcionalidad de bash, es hora de ver como desarrollar una
aplicación entera en bash. En el próximo capítulo veremos como hacer eso. ¡Hasta entonces!
Bash by example

Bash con ejemplos, Parte 3

1. Explorando el sistema de ebuilds

Entra en el sistema de ebuilds

He estado deseando que llegara este capítulo final de Bash con ejemplos, porque ahora que hemos cubierto
los conceptos básicos de la programación en bash, Parte 1 y Parte 2, podemos centrarnos en temas más
avanzados, como el desarrollo de aplicaciones en bash y diseño de programas. Te daré una buena dosis de
programación práctica, del mundo real, presentando un proyecto en cuya codificación y refinamiento he
invertido muchas horas: El sistema de Ebuilds de Gentoo.

Soy el arquitecto líder de Gentoo Linux, un sistema Linux de próxima generación, actualmente en estado
beta. Una de mis principales responsabilidades es asegurarme de que todos los paquetes binarios (similares
a los RPM) se crean correctamente, y funcionan bien en conjunto. Como probablemente sepas, un sistema
Linux estándar no está compuesto de un solo árbol unificado de fuentes, como en el caso de BSD, sino que
está compuesto de más de 25 paquetes críticos que funcionan juntos. Algunos de estos paquetes son:

Paquete Descripción
linux El kernel actual
Una colección de programas variados relacionados con
util-linux
Linux
e2fsprogs Una colección de utilidades relacionadas con ext2
glibc La librería C de GNU
Cada paquete viene en su propio tarball, y es mantenido por desarrolladores o equipos de desarrollo
distintos. Para crear una distribución, cada paquete debe ser descargado por separado, compilado, y
empaquetado, cada vez que el paquete necesita ser reparado, actualizado o mejorado. Todo esto debe ser
repetido (algunos paquetes quedan desfasados realmente rápidot). Para ayudar en este proceso tan
repetitivo, he creado el sistema de ebuilds. Escrito casi por completo en bash. Y para mejorar tu
conocimiento de bash, te enseñaré como implementé las secciones de desempaquetado y compilado del
sistema de ebuilds. Al explicar cada paso, explicaré también por qué se hicieron ciertas decisiones. Al final de
este artículo, no solo tendrás una visión de proyectos en bash a mayor escala, sino que también habrás
implementado una buena porción de un sistama de autocompilado.

¿Por qué bash?

Bash es un componente esencial del sistema de ebuilds de Gentoo Linux. Fue elegido como el lenguaje
primario para los ebuilds por varias razones. En primer lugar, posee una sintaxis familiar y asequible, muy
apropiada para el uso de programas externos. Un sistema de autocompilado es un código intermedio que
automatiza la llamada a programas externos, y bash es un lenguaje particularmente apropiado para este tipo
de aplicación. Segundo, el soporte de bash para funciones permite al sistema de ebuilds adoptar un diseño
modular, fácil de entender. Tercero, el sistema de ebuilds saca provecho del soporte de bash para las
variables de entorno, permitiendo a los mantenedores de paquetes y a los desarrolladores reconfigurarlo al
vuelo.

Revista al proceso de construcción

Antes de entrar en el sistema de ebuilds de lleno, tendremos que conocer los pasos necesarios para compilar
e instalar un paquete. Para nuestro ejemplo usaremos el paquete "sed", un editor estándar de flujos GNU
que es parte integrante de todas las distribuciones de Linux. Primero descarga el archivo con las fuentes
(sed-3.02.tar.gz) (ver Recursos). Almacenaremos este archivo en /usr/src/distfiles, un directorio
al que nos referiremos usando la variable de entorno $DISTDIR. $DISTDIR es el directorio donde se
guardarán todos los tarball de código fuente, será un gran almacén de código fuente.

Nuestro siguiente paso será crear un directorio temporal work, que aloje los fuentes descomprimidos. Nos
referiremos a este directorio usando la variable $WORKDIR. Para ésto, cambia a un directorio sobre el que
tengas permiso de escritura y escribe lo siguiente:

Listado de Código 1.1: Descomprimiendo sed en un directorio


temporal
$ mkdir work
$ cd work
$ tar xzf /usr/src/distfiles/sed-3.02.tar.gz
Ahora el tarball está descomprimido, habrá creado un directorio llamado sed-3.02, que contiene las
fuentes de sed. Nos referiremos a dicho directorio sed-3.02 más tarde usando la variable de
entorno $SRCDIR. Para compilar el programa teclea lo siguiente:

Listado de Código 1.2: Uncompressing sed into a temporary directory


$ cd sed-3.02
$ ./configure --prefix=/usr
(autoconf generará los archivos make adecuados, esto puede tardar)

$ make

(el paquete se compila desde fuente, también tardará un poco)


Vamos a saltarnos el paso "make install", ya que solo estamos cubriendo los pasos de desempaquetado y
compilación en este artículo. Si quisiéramos usar un script de bash para realizar todos estos pasos por
nosotros haríamos algo como:

Listado de Código 1.3: Script bash de ejemplo para desempaquetar y


compilar
#!/usr/bin/env bash

if [ -d work ]
then
# remove old work directory if it exists
rm -rf work
fi
mkdir work
cd work
tar xzf /usr/src/distfiles/sed-3.02.tar.gz
cd sed-3.02
./configure --prefix=/usr
make
Generalizando el código

Aunque este script de autocompilado funciona, no es muy flexible. Básicamente, el script contiene la lista de
los comandos que han sido escritos anteriormente en línea de comandos. Esta solución funciona, pero sería
mucho mejor tener un script más genérico que pudiera configurar y desempaquetar cualquier paquete,
quizás cambiando solo unas pocas líneas. El trabajo para el mantenedor del paquete se ve así disminuído, y
es más fácil añadir nuevos paquetes a la distribución. Podemos usar variables de entorno para hacer nuestro
script más genérico:

Listado de Código 1.4: Un script nuevo, más genérico


#!/usr/bin/env bash

# P es el nombre del paquete

P=sed-3.02

# A es el nombre del archivo comprimido

A=${P}.tar.gz

export ORIGDIR=`pwd`
export WORKDIR=${ORIGDIR}/work
export SRCDIR=${WORKDIR}/${P}

if [ -z "$DISTDIR" ]
then
# DISTDIR es /usr/src/distfiles si no ha sido definido ya
DISTDIR=/usr/src/distfiles
fi
export DISTDIR

if [ -d ${WORKDIR} ]
then
# borra el directorio de trabajo antiguo si es que existe
rm -rf ${WORKDIR}
fi

mkdir ${WORKDIR}
cd ${WORKDIR}
tar xzf ${DISTDIR}/${A}
cd ${SRCDIR}
./configure --prefix=/usr
make
Hemos añadido muchas variables al nuevo código, pero, básicamente, todavía hace lo mismo. Sin embargo,
ahora podemos compilar cualquier paquete basado en GNU autoconf. Simplemente copiando este archivo
con un nuevo nombre que refleje el nombre del paquete, y cambiando los valores de $A y $P, compilará. Las
demás variables se ajustarán automáticamente. Si bien es útil, hay aún mejoras que podemos introducir en
este código. Este código es bastante más largo que el original. Ya que una de las tareas principales de
cualquier proyecto de programación es reducir la complejidad de cara al usuario, estaría bien reducir un
poco la longitud del cógido, o, al menos, organizarlo un poco mejor. Podemos hacer esto con un ingenioso
truco -- separaremos el código en dos ficheros separados, guarda lo siguiente como sed-3.02.ebuild:
Listado de Código 1.5: sed-3.02.ebuild
#fichero ebuild para sed - ¡simple!
P=sed-3.02
A=${P}.tar.gz
Nuestro primer fichero es trivial, y contiene solo variables de entorno, que han de ser configuradas paquete
por paquete, el segundo fichero contiene el cerebro de la operación. Guárdalo como "ebuild" y hazlo
ejecutable:

Listado de Código 1.6: The ebuild script


#!/usr/bin/env bash

if [ $# -ne 1 ]
then
echo "se esperaba un argumento."
exit 1
fi

if [ -e "$1" ]
then
source $1
else
echo "ebuild $1 no encontrado."
exit 1
fi

export ORIGDIR=`pwd`
export WORKDIR=${ORIGDIR}/work
export SRCDIR=${WORKDIR}/${P}

if [ -z "$DISTDIR" ]
then
# DISTDIR será /usr/src/distfiles si no está ya definido
DISTDIR=/usr/src/distfiles
fi
export DISTDIR

if [ -d ${WORKDIR} ]
then
# borra directorio antiguo si ya existía
rm -rf ${WORKDIR}
fi

mkdir ${WORKDIR}
cd ${WORKDIR}
tar xzf ${DISTDIR}/${A}
cd ${SRCDIR}
./configure --prefix=/usr
make
Ahora que hemos dividido nuestro sistema en dos ficheros, apuesto a que te estarás preguntando como
funciona. Fácil, para compilar sed, escribe:

Listado de Código 1.7: Probando el ebuild


$ ./ebuild sed-3.02.ebuild
Cuando "ebuild" se ejecuta, primero intenta interpretar $1. ¿Que significa esto? Recuerda de mi anterior
artículo, que $1 es el primer argumento de línea de comandos, en este caso sed-3.02.ebuild. En bash, el
comando "source" lee instrucciones bash de un archivo y las ejecuta como si estuvieran dentro del fichero
desde donde se usa el comando "source". Así que "source" ${1}" causa que el script "ebuild" ejecute los
comandos contenidos en sed-3.02.ebuild, de este modo, $P y $A son definidos. Este cambio de diseño es
realmente conveniente, porque si queremos compilar otro programa, en lugar de sed, tan solo necesitamos
un nuevo fichero .ebuild que pasar a nuestro script "ebuild". De este modo, los ficheros .ebuild son
realmente simples, mientras la parte complicada del sistema se almacena en el script "ebuild". De esta forma,
también se puede mejorar o actualizar el sistema ebuild simplemente editando el script, manteniendo los
detalles de la implementación fuera de los ficheros ebuild. Aquí hay un fichero ebuild de ejemplo para gzip:

Listado de Código 1.8: gzip-1.2.4a.ebuild


#Otro script ebuild realmente simple
P=gzip-1.2.4a
A=${P}.tar.gz

Añadiendo funcionalidad

Bien, ya hemos hecho algún progreso, pero hay funcionalidades adicionales que me gustaría añadir. Me
gustaría que el script ebuild aceptara un segundo parámetro que será compile, unpack, o all. Este
segundo parámetro dirá al ebuild la operación que debe realizar. De esta forma, puedo decirle a ebuild que
desempaquete el archivo pero sin compilarlo (por si necesito inspeccionar el código fuente antes de la
compilación). Para hacer esto usaremos una estructura case, que comprobará la variable $2, y actuará de
acuerdo con su valor. El código sería algo así:

Listado de Código 1.9: ebuild, revisión 2


#!/usr/bin/env bash

if [ $# -ne 2 ]
then
echo "Por favor, especifique dos argumentos, el fichero .ebuild y"
echo "unpack, compile or all"
exit 1
fi

if [ -z "$DISTDIR" ]
then
# DISTDIR será /usr/src/distfiles si no está ya definido
DISTDIR=/usr/src/distfiles
fi
export DISTDIR

ebuild_unpack() {
#nos aseguramos de estar en el directorio correcto
cd ${ORIGDIR}

if [ -d ${WORKDIR} ]
then
rm -rf ${WORKDIR}
fi

mkdir ${WORKDIR}
cd ${WORKDIR}
if [ ! -e ${DISTDIR}/${A} ]
then
echo "${DISTDIR}/${A} no existe. Por favor, descárguelo primero."
exit 1
fi
tar xzf ${DISTDIR}/${A}
echo "Desempaquetado ${DISTDIR}/${A}."
#el código fuente está descomprimido
}

ebuild_compile() {

#nos aseguramos de estar en el directorio correcto


cd ${SRCDIR}
if [ ! -d "${SRCDIR}" ]
then
echo "${SRCDIR} no existe -- por favor, descomprima primero el paquete."
exit 1
fi
./configure --prefix=/usr
make
}

export ORIGDIR=`pwd`
export WORKDIR=${ORIGDIR}/work

if [ -e "$1" ]
then
source $1
else
echo "Ebuild $1 no encontrado."
exit 1
fi

export SRCDIR=${WORKDIR}/${P}

case "${2}" in
unpack)
ebuild_unpack
;;
compile)
ebuild_compile
;;
all)
ebuild_unpack
ebuild_compile
;;
*)
echo "Por favor, especifique unpack, compile o All como segundo argumento"
exit 1
;;
esac
Hemos hecho varios cambios, así que revisémoslos. Primero, hemos puesto las órdenes para desempaquetar
y compilar los paquetes en su propia función. Las hemos
llamado ebuild_compile() y ebuild_unpack(), respectivamente. Ha sido un buen movimiento, ya que
el código se está complicando, y las funciones lo dotan de algo más de modularidad, lo que nos ayudará a
mantener el script ordenado. En la primera línea de cada función, se cambia de forma explícita, con cd, al
directorio al que se quiere ir. Al complicarse nuestro código es muy probably que terminemos ejecutando
algo en un directorio distinto del correcto, así, nos aseguramos de estar en el lugar correcto antes de hacer
nada, con cd, y nos ahorraremos posible errores más adelante. Ésto es un paso importante, sobre todo, si se
borran ficheros dentro de una función.

También he añadido un test al principio de la función ebuild_compile(). Ahora comprueba que el


directorio $SRCDIR existe, y, si no, imprime un mensaje de error diciéndole al usuario que desempaquete el
archivo y sale. Si lo prefieres, puesdes cambiar el comportamiento de forma que, si $SRCDIR no existe,
nuestro ebuild desempaquete automáticamente el archivo. Puedes hacerlo
cambiando ebuild_compile() por esta nueva versión:

Listado de Código 1.10: Nueva versión de ebuild_compile()


ebuild_compile() {
#nos aseguramos de estar en el directorio correcto
if [ ! -d "${SRCDIR}" ]
then
ebuild_unpack
fi
cd ${SRCDIR}
./configure --prefix=/usr
make
}
Uno de los cambios más obvios en nuestro script ebuild es la estructura case añadida al final del mismo.
Dicha estructura simplemente chequea el segundo argumento de línea de comandos, y, en base al valor del
mismo, decide la acción a realizar. Si ahora ejecutamos esto:

Listado de Código 1.11: Acción predeterminada


$ ebuild sed-3.02.ebuild
Obtendremos un mensaje de error, porque ebuild ahora necesita que le digamos qué hacer, de esta forma:

Listado de Código 1.12: Descomprimir


$ ebuild sed-3.02.ebuild unpack
or:

Listado de Código 1.13: Compilar


$ ebuild sed-3.02.ebuild compile
or:

Listado de Código 1.14: Descomprimir y compilar


$ ebuild sed-3.02.ebuild all
Importante: Si se suministra un segundo parámetro distinto de los usados más arriba, se obtiene un
mensaje de error (caso *), y el programa termina.
Modularizando el código

Ahora que el código es más avanzado y funcional, puede que estés pensando en crear varios ebuilds para
desempaquetar y compilar tus programas favoritos. Si lo hicieras, tarde o temprano comprobarías que
algunas fuentes no usan autoconf (./configure), sino que se valen de otros procesos de compilación no
estándar. Tenemos que modificar el sistema de ebuilds para que se acomode a estos programas. Pero antes
de hacerlo, es bueno pararse a pensar como conseguiremos esto.

Una de las grandes ventajas de usar siempre ./configure --prefix=/usr; make en la fase de
compilación, es que, la mayoría de las veces funciona. Pero también debemos hacer que el sistema de
ebuilds funcione con aquellos fuentes que no usan autoconf, o fichero Make normales. Propongo lo
siguiente, como solución a este problema:

1. Si hay un script configure en ${SRCDIR}, ejecutarlo de esta forma: ./configure --prefix=/usr.


De otro modo, saltarse este paso.

2. Ejecutar el comando siguiente: make

Los ebuilds solo ejecutarán configure si dicho script existe. Así hacemos que ebuild funcione con programas
que no usan autoconf, y tienen un fichero Make estándar. Pero, ¿y si un simple "make" no funciona con
algunos fuentes? Necesitamos una forma de saltarse esta funcionalidad predefinida, usando un código
alternativo para manejar situaciones específicas. Para esto, convertiremos nuestra
función ebuild_compile() en dos funciones. La primera de dichas funciones puede ser vista como "padre"
de la segunda, y se llamará ebuild_compile(). La nueva función, llamada user_compile(), contendrá
nuestras acciones predeterminadas:

Listado de Código 1.15: ebuild_compile() separada en dos funciones


user_compile() {
#estamos en ${SRCDIR}
if [ -e configure ]
then
#run configure script if it exists
./configure --prefix=/usr
fi
#run make
make
}

ebuild_compile() {
if [ ! -d "${SRCDIR}" ]
then
echo "${SRCDIR} no existe -- por favor, descomprima primero."
exit 1
fi
#se asegura de que estamos en el directorio correcto
cd ${SRCDIR}
user_compile
}
Puede que no parezca obvio el por qué de todo esto ahora mismo. Así que, por ahora, sigamos. Si bien el
código de arriba funciona de forma idéntica a la anterior versión de ebuild, ahora podemos hacer algo que no
podiamos hacer antes. Podemos redefinir la función user_compile() en sed-3.02.ebuild. Así, si la
predeterminada user_compile() no sirve a nuestras necesidades, podemos redefinirla por completo en
nuestro fichero .ebuild. Como ejemplo, un fichero .ebuild para e2fsprogs-1.18, que requiere una
línea ./configure ligeramente modificada:

Listado de Código 1.16: e2fsprogs-1.18.ebuild


#este fichero ebuild redefine user_compile()
P=e2fsprogs-1.18
A=${P}.tar.gz

user_compile() {
./configure --enable-elf-shlibs
make
}
Ahora, e2fsprogs será compilado de la forma correcta. Para la mayoría de los paquetes, esto no es
necesario. Simplemente omitiendo la definición de user_compile() en nuestro fichero .ebuild,
conseguiremos que se use la función user_compile()predeterminada.

¿Como sabe el script ebuild que función user_compile() debe usar? Muy sencillo: en el script ebuild, la
función user_compile() es definida antes de que el fichero .ebuild e2fsprogs-1.18.ebuild sea leído.
Si hay una función user_compile() en e2fsprogs-1.18.ebuild, dicha función sobreescribe a la versión
predeterminada, definida previamente. Si no, la primera versión es usada.

Hemos añadido una gran funcionalidad sin requerir ningún tipo de codificación compleja. No lo explicaré
aquí, pero se podría hacer algo similar con la función ebuild_unpack(), de forma que podamos reescribir
el proceso de desempaquetado predeterminado. Esto podría ser práctico si se tiene que hacer algún tipo de
parcheo o si los ficheros están contenido en múltiples archivos comprimidos. También sería una buena idea
modificar el código de desempaquetado de forma que reconozca tarballs comprimidos con bzip2 por
defecto.

Ficheros de configuración

Hemos cubierto varias técnicas interesantes de bash, y ahora es el momento de aprender una más. A
menudo es práctico para un programa tener un fichero de configuración global que resida en /etc.
Afortunadamente, esto es fácil cuando se usa bash. Simplemente crea este fichero y guárdalo
como /etc/ebuild.conf:

Listado de Código 1.17: /ect/ebuild.conf


# /etc/ebuild.conf: configuraciones globales de ebuild

# MAKEOPTS son las opciones pasadas a make


MAKEOPTS="-j2"
En este ejemplo he incluído una sola opción de configuración, pero se podrían incluír muchas más. Una de
las cosas interesantes de bash es que el fichero se puede interpretar simplemente usando el comando
"source" sobre el mismo. Éste es un truco de diseño que funciona con la mayoría de lenguajes interpretados.
Después de que /etc/ebuild.conf haya sido interpretado, $MAKEOPTS está definido en nuestro script
.ebuild, y le permite al usuario pasar dichas opciones a make. En este caso, la opción le dice al ebuild que
lance una instancia paralela de make.

Nota: ¿Qué es una instancia paralela de make? Las instancias paralelas pueden servir para
agilizar el proceso en sistema con varios procesadores. Make soporta la compilación en paralelo.
Esto significa que, en lugar de compilar un fichero fuente en un momento dado, make puede
compilar un número de ficheros (dado por el usuario) al mismo tiempo. En un sistema
multiprocesador esto hace que se usen estos procesadores extra. Make en paralelo se activa al
interpretar la opción -j # pasada a make, de esta forma: make -j4 MAKE="make -j4". Esto
instruye a make para compilar cuatro programas de forma simultánea. El argumento MAKE="make
-j4" le dice a make que pase la opción -j4 a cualquier proceso hijo que lance.
Y aquí tenemos la versión final de ebuild:

Listado de Código 1.18: ebuild, la versión final


#!/usr/bin/env bash

if [ $# -ne 2 ]
then
echo "Por favor, especifique fichero ebuild file y unpack, compile u all"
exit 1
fi

source /etc/ebuild.conf

if [ -z "$DISTDIR" ]
then
# configura DISTDIR como /usr/src/distfiles si no está configurado ya
DISTDIR=/usr/src/distfiles
fi
export DISTDIR

ebuild_unpack() {
#se asegura de estar en el directorio correcto
cd ${ORIGDIR}

if [ -d ${WORKDIR} ]
then
rm -rf ${WORKDIR}
fi

mkdir ${WORKDIR}
cd ${WORKDIR}
if [ ! -e ${DISTDIR}/${A} ]
then
echo "${DISTDIR}/${A} no existe. Por favor, descargue primero."
exit 1
fi
tar xzf ${DISTDIR}/${A}
echo "Unpacked ${DISTDIR}/${A}."
#las fuentes han sido descomprimidas
}

user_compile() {
#ya estamos en ${SRCDIR}
if [ -e configure ]
then
#ejecuta el script configure si existe
./configure --prefix=/usr
fi
#ejecuta make
make $MAKEOPTS MAKE="make $MAKEOPTS"
}

ebuild_compile() {
if [ ! -d "${SRCDIR}" ]
then
echo "${SRCDIR} no existe -- por favor, descomprima primero."
exit 1
fi
#se asegura de estar en el directorio correcto
cd ${SRCDIR}
user_compile
}

export ORIGDIR=`pwd`
export WORKDIR=${ORIGDIR}/work

if [ -e "$1" ]
then
source $1
else
echo "Fichero .ebuild $1 no encontrado."
exit 1
fi

export SRCDIR=${WORKDIR}/${P}

case "${2}" in
unpack)
ebuild_unpack
;;
compile)
ebuild_compile
;;
all)
ebuild_unpack
ebuild_compile
;;
*)
echo "Por favor, especifique unpack, compile u all como segundo argumento"
exit 1
;;
esac
/etc/ebuild.conf es interpretado cerca del principio del fichero. Usamos $MAKEOPTS en
nuestra user_compile() prefabricada. Puede que te preguntes como funcionará ésto -- después de todo,
nos referimos a $MAKEOPTS antes de interpretar/etc/ebuild.conf, que es el encargado de
definir $MAKEOPTS. Afortunadamente, ésto no es problema, porque la expansión de variables se produce al
ejecutar user_compile(). Cuando eso sucede, /etc/ebuild.conf ha sido ya incorporado
y $MAKEOPTS tiene un valor correcto.

Resumiendo

Hemos cubierto muchas técnicas de programación en bash en este artículo, pero en realidad solo hemos
arañado la superficie de lo que el poder auténtico de bash representa. Por ejemplo, el sistema de ebuilds de
Gentoo no solo puede desempaquetar y compilar de forma automática, sino que también:

• Descarga las fuentes de forma automática si no están en $DISTDIR

• Verifica que las fuentes no están corruptas, usando sumas MD5

• Si se especifica, instala el programa compilado en un sistema de archivos, en vivo, manteniendo un


listado de los ficheros instalados de forma que el paquete pueda ser fácilmente desinstalado en
cualquier momento.

• Si se especifica, puede empaquetar una aplicación instalada en un tarball (comprimido) de forma que
pueda ser instalada después, en otro ordenador, o durante un proceso de instalación basado en CD
(por ejemplo, si estás contruyendo una distribución basada en dicho medio).

De forma adicional, el sistema ebuild en producción tiene otras opciones globales de configuración, que
permiten al usuario establecer banderas de optimización que se usan en tiempo de compilación, o el soporte
específico que se quiere en ciertas aplicaciones. Por ejemplo, los soportes para GNOME y slang se activan de
forma predeterminada en los paquetes que lo soportan.

Bash puede hacer mucho más de lo que he tocado en esta serie de artículos. Espero que hayas aprendido
mucho sobre esta increíble utilidad, y que estés deseando usar bash para acelerar y mejorar tus proyectos de
desarrollo.

Vous aimerez peut-être aussi