• Acerca de mi:

    Soy un programador de alma inquieta. Las computadoras te incitan a programar, y una vez que empiezas, no se puede detener.

  • Etiquetas

  • DRAE buscón en texto: la Real Academia en un script

    By cesar | diciembre 22, 2009

    Gran parte de mi tiempo en la computadora pasa en la interfaz de mandatos (CUI) del shell.

    Cuando tengo dudas sobre si cierta palabra existe en castellano o simplemente es una de las tantas que estamos en el proceso de inventar, consulto el DRAE, el Diccionario de la Real Academia Española en http://buscon.rae.es/draeI/.

    La interfaz del buscador es limpia pero me obliga a usar un navegador web, embocar una caja de diálogo con mi consulta, y luego decodificar la salida.

    Bienvenido al mundo de los scripts de bash y sus amigos.

    #!/bin/bash
    URL_BUSCON="http://buscon.rae.es/draeI/SrvltObtenerHtml?origen=RAE&LEMA=$1&SUPIND=0&CAREXT=10000&NEDIC=No#0_1"
    
    curl ${URL_BUSCON} 2>/dev/null \
    | html2text -nobs \
    | sed "s/ñ/ñ/g"

    Si guardas ese script con el nombre /usr/local/bin/drae vas a poder consultar una palabra de la siguiente manera:

      drae término

    y tendrás en la salida estándar el significado oficial.

    curl baja la respuesta de buscón, html2text analiza el HTML (sólo entiende la versión 3.2, pero en mis pruebas ha salido exitoso) y por último sed cambia la entidad que corresponde a la «eñe» de «Española» que de otro modo afearía el resultado final.

    ¡Gracias DRAE!

    Share

    Topics: programación | 5 Comments »

    « Previous Entries