Un ejemplo concreto de la utilidad de los scripts
30 de Marzo de 2013
Escribí el script a continuación en mi trabajo para extraer datos que no podía obtener de otra manera. Lo publico aca, no por la calidad del código (lo hice en modo "quick and dirty") pero mas bien porque pienso que ilustra bien la utilidad de los scripts en el trabajo cotidiano de un geomático.
Explicación
Estaba buscando información sobre las empresas de Puerto Príncipe en Haiti. Después de una rápida búsqueda en internet, me encontré con este sitio, que es un catálogo de empresas y que presenta cada una a través de una página individual (como esa o esta). Ví que el URL era siempre el mismo (http://haiti.buildingmarkets.org/fr/supplier/) y solamente cambiaba el id de la empresa. Eso significa que era possible iterar sobre el id y, página (empresa) por página (empresa), recuperar la información que quería. Además, lo bueno con este sitio es que contiene las coordenadas geográficas de las empresas, enctonces puedo mapearlas! Que mas puedo pedir?
El script
El script esta hecho en Python y he utilizado los modulos urllib2 y BeautifulSoup. El primero para conectarme a las páginas web y recuperar el código. El segundo para extraer los datos que me interesan dentro del código HTML. Como lo dije antes, el objetivo de este post no es el código en si, asi que no le puse muchos comentarios pero es bastante facil de entender. Lo que hay que notar es que las coordenadas geográficas estan en grados, minutos decimales, enctonces hay que convertirlas a grados decimales para que puedan ser procesadas. (Para ver la formula de la conversion, consultar esta página).
# -*- coding: cp1252 -*- tel1 tel2 mail site nb_employe ") nextSibling.nextSibling.nextSibling.nextSibling # correspond a la div class = content-box + " " + direccion + " " + commune + " " + lat+ " " + lon + " " + tel1 + " " + tel2 + " " + mail + " " + site + " " + nb_employ + " " + " ") |
El resultado es este archivo. Contiene 1700 empresas con sus coordenadas y otras informaciones. Ahora solo falta convertirlo en un archivo vector con Qgis y el plugin "Añadir capa de texto delimitado".
Conclusión
Con este ejemplo, vemos la utilidad de los scripts. Nos permiten obtener un resultado rapidamente sin usar conceptos de programación muy avanzados. Aca lo use para conectarme a unas páginas web y extraer información dentro de ellas pero obviamente las posibilidades son sin fín (cálculo científico, gestión de archivos, conexión a una base de datos, ...). Es una herramienta muy útil y poderosa y es la razón por la cual pienso que los geomaticos, que muy a menudo trabajamos con fuentes y formatos de datos diferentes, debemos tener al menos un conocimiento mínimo. Y sin duda, el lenguaje mas adecuado de conocer para un geomático es Python. Si tienen que conocer un solo lenguaje, es este.