лучшие брокеры бинарных опционов
али эксперс

Las habladurías del mundo

Las huellas de quienes nos informan quedan  -por suerte- en la web. En una especie de repositorio de la historia reciente o futura. Hechos que recuerdo intensos pueden ser gratamente -o no- rememorados naufragando un poco.

Venía de comer con unos amigos donde últimamente -y por suerte- las discusiones políticas acaparan la escena, me pregunté qué carajo nos decían allá por el 2001, mientras era un estudiante universitario-puber-adolescente a la espera del famoso estirón que me debía la vida, aquellos medios gráficos ingenuamente incuestionados. Me llevé una sopresa al releer velozmente las tapas del GRAN DIARIO ARGENTINO, pero me cansé de ir bajando una a una cada portada.

Por ahí se dice que la característica que distingue a los informáticos es la pereza. Coincidiendo completamente con esta afirmación, me puse a programar con python para descargar automáticamente todas las tapas del diario clarin entre un intervalo de fechas dado. Toqueteando un poco otro script me armé esto:

def get_big_liar(file_name,file_mode,base_url,fecha):
	from urllib2 import Request, urlopen, URLError, HTTPError

	# Armo la url de "El Gran Diario Argentino (GDA)"
	fechaweb=fecha.strftime("%Y/%m/%d")+"/"
	url = base_url + fechaweb + file_name

	# Hago el request
	req = Request(url)

	# Abro url
	try:
		f = urlopen(req)
		print "downloading " + url
		# Armo el nombre de archivo usando la fecha
		local_file = open(fecha.strftime("%Y-%m-%d")+".jpg", "w" + file_mode)
		# Escribo el archivo localmente
		local_file.write(f.read())
		local_file.close()

	# handle errors
	except HTTPError, e:
		print "HTTP Error:",e.code , url
	except URLError, e:
		print "URL Error:",e.reason , url

# Para ir armando las fechas
import datetime

# Fecha inicio y final (anio, mes, dia)
fini=datetime.date(2001, 01, 01)
fend=datetime.date(2001, 12, 31)

# Una tapa por dia
one_day = datetime.timedelta(days=1)
# Nombre del archivo
file_name="portada.jpg"
# URL fija
base_url="http://edant.clarin.com/diario/"

# Itero entre el intervalo
while fini<=fend:
	get_big_liar(file_name,"b",base_url,fini)
	fini+=one_day

Corriéndolo vas a bajarte todas las tapas entre el 1 de enero y el 31 de diciembre de 2001. Fijate esta tapa del 4 de diciembre, es una joyita (me costó entender que no era la revista barcelona) :

Decían los chinos: Ojalá te toquen vivir tiempos interesantes.
Acá todas las tapas.

Leave a Comment


NOTE - You can use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Social Widgets powered by AB-WebLog.com.

Social Widgets powered by AB-WebLog.com.

Social Widgets powered by AB-WebLog.com.