DRAE buscón en texto: la Real Academia en un script
By cesar | diciembre 22, 2009
Gran parte de mi tiempo en la computadora pasa en la interfaz de mandatos (CUI) del shell.
Cuando tengo dudas sobre si cierta palabra existe en castellano o simplemente es una de las tantas que estamos en el proceso de inventar, consulto el DRAE, el Diccionario de la Real Academia Española en http://buscon.rae.es/draeI/.
La interfaz del buscador es limpia pero me obliga a usar un navegador web, embocar una caja de diálogo con mi consulta, y luego decodificar la salida.
Bienvenido al mundo de los scripts de bash y sus amigos.
#!/bin/bash
URL_BUSCON="http://buscon.rae.es/draeI/SrvltObtenerHtml?origen=RAE&LEMA=$1&SUPIND=0&CAREXT=10000&NEDIC=No#0_1"
curl ${URL_BUSCON} 2>/dev/null \
| html2text -nobs \
| sed "s/ñ/ñ/g"
Si guardas ese script con el nombre /usr/local/bin/drae vas a poder consultar una palabra de la siguiente manera:
drae término
y tendrás en la salida estándar el significado oficial.
curl baja la respuesta de buscón, html2text analiza el HTML (sólo entiende la versión 3.2, pero en mis pruebas ha salido exitoso) y por último sed cambia la entidad que corresponde a la «eñe» de «Española» que de otro modo afearía el resultado final.
¡Gracias DRAE!
Topics: programación | 5 Comments »