שירים להורדה ישירה בחינם לפלאפון
http://kottik.xyz/shop/
גוגלה תרגום
лучшие бинарные опционы
קמגרה
лучший онлайн магазин

Tag Archives: Política

Los 24 de Marzo

 

Me preguntaba cómo habrán sido las tapas de los diarios argentinos a lo largo de la historia para los 24 de marzo, por supuesto desde 1976 al día de la fecha.

Como ya había estado descargando anteriormente todas las tapas de la mayor corporación mediática de Argentina con serios tintes mafiosos, me dije, “vamos a compararlos con otros”.

Sería interesante ver qué publicaban en tapa y contrastar a Página 12, Clarin y La Nación.

Acá me encontré con una serie de complicaciones que no esperaba. Primero, lo único que tenía resuelto antes de arrancar ya no funcionaba, el gran diario argentino había cambiado el modo de acceder a sus tapas, con lo cuál tenía que empezar de cero.

Lamentablemente el diario conservador y ultra-católico de los Mitre no publica un registro de sus tapas, al menos, luego de haber recorrido su sitio web no pude encontrarlas.

Por lo tanto me quedaba ver si el Página 12 tenía un modo de acceder a sus tapas y ya olfateaba que esto iba a ser poco menos que un parto. Por suerte logré encontrar cómo acceder a las imágenes, sin embargo es un diario bastante nuevo comprarado con los otros, existe desde 1987, y el acceso a sus tapas data desde el 1998.

Entonces, hagamos lo que se puede, vamos a comparar las tapas de cada 24 de Marzo desde 1998 a 2013, ya que clarín no permite el acceso a la última tapa, aunque supongo que la mayoría intuirá la relevancia que tuvo en la portada este nuevo aniversario del golpe de estado.

La solución a este breve desafío se puede resumir en lo siguiente:

  • Descargar las tapas de cada uno de los diarios en el rango de fechas.
  • Acomodar el tamaño para que sean parecidos, lo mejor posible, porque tampoco siempre tienen el mismo tamaño.
  • Unir las dos tapas en una imagen.

Para resolver el primer item tuve que analizar en cada sitio web cuál es el patrón de las URLs para acceder a las tapas. En clarín es muy fácil el acceso, la url que hay que armar es la siguiente:

http://tapas.clarin.com/tapa/2013/03/24/20130324_thumb.jpg

Donde la fecha hay que armarla haciendo y + “/” + m + “/” + d + “/” + y + m + d, y finalmente concatenarla a “http://tapas.clarin.com/tapa/” y agregándole al final “_thumb.jpg”.

En Página el acceso a las tapas es un verdadero lío, sobretodo en los primeros años de su creación. El nombre de archivo no es siempre el mismo, varían anárquicamente entre: tapan.jpg, Tapan.jpg , TAPAN.JPG, tapagn.jpg y TAPAGN.JPG. Además de esto, a veces se almacenan en

http://www.pagina12.com.ar/fotos/”+fecha+”/diario/”+filename

donde fecha es algo así: y + “/” + y[2] + y[3] +”-“+ m +”/”+ y[2] + y[3] +”-“+ m +”-“+ d

Y otras veces están en http://www.pagina12.com.ar/”+fecha+”/”+filename donde fecha es y+m+d.

Entonces, todo esto en un script python en el que para resolver esta última anarquía comento a manopla las urls, fecha y filename donde buscar (ejemplo 1 y ejemplo 2 en el código).

from urllib2 import Request, urlopen, URLError, HTTPError

def get_tapa(diario,file_mode,y,m,d):

    if diario == "clarin":
        # Armo la url de clarin
        fecha = y + "/" + m + "/" + d + "/" + y + m + d
        filename = "_thumb.jpg"
        url = "http://tapas.clarin.com/tapa/"+fecha+filename
    elif diario == "pagina12":
        # Armo las urls de pagina12

        # 1 - Ejemplo: http://www.pagina12.com.ar/2000/00-03/00-03-24/tapan.jpg
        fecha = y + "/" + y[2] + y[3] +"-"+ m +"/"+ y[2] + y[3] +"-"+ m +"-"+ d
        filename = "tapan.jpg"
        url = "http://www.pagina12.com.ar/"+fecha+"/"+filename

        # 2 - Ejemplo: http://www.pagina12.com.ar/fotos/20130324/diario/
        # El filename puede ser:
        #                tapan.jpg Tapan.jpg TAPAN.JPG
        #                tapagn.jpg TAPAGN.JPG
        #filename = "TAPAGN.JPG"
        #fecha = y+m+d
        #url = "http://www.pagina12.com.ar/fotos/"+fecha+"/diario/"+filename

    # Hago el request
    req = Request(url)

    try:
        # Abro url
        f = urlopen(req)
        print "downloading " + url

        # Armo el nombre de archivo usando la fecha y el filename
        local_file = open("tapas_24Marzo/"+diario+"/"+diario+ y +"-"+ m +"-"+ d +"-"+filename[:-4]+".jpg", "w" + file_mode)

        # Escribo el archivo localmente
        local_file.write(f.read())
        local_file.close()		

    # handle errors
    except HTTPError, e:
        print "HTTP Error:",e.code , url

    except URLError, e:
        print "URL Error:",e.reason , url

if __name__ == "__main__":

    print "starting..."

    # Fecha inicio y final
    y,m,d = "1974", "03", "24"
    y_fin = "2014"

    # Itero entre el intervalo
    for a_year in range(int(y),int(y_fin)+1):
    	get_tapa("clarin","b",str(a_year),m,d)
    	get_tapa("pagina12","b",str(a_year),m,d)

Las imágenes, como era de esperar tienen diferente tamaño y no siempre el mismo, las de clarín son un poco más de el doble. Así que voy a hacer un script en bash usando imagemagick para redimensionar todas imágenes a un 45% de su tamaño original. Sería:

#!/bin/bash

for i in $(ls tapas_24Marzo/clarin/*.jpg)
do
	convert $i -resize 45% tapas_24Marzo/clarin/half/${i:21}
	#echo tapas_24Marzo/clarin/half/${i:21}
done

Ahora queda hacer otro script para unir en una imagen las dos tapas. Esto no lo generalizo porque no le puse un mismo nombre de archivo a los de Página, tuve la mala idea de dejarle el nombre original, que como les decía es un caos. Sin embargo, es una tarea que no reviste mayor complejidad para hacerlo manualmente:

convert +append clarin2013-03-24.jpg pagina122013-03-24-tapan.jpg 2013-03-24_clarin-pagina12.jpg

Al inicio del post está el álbum comparativo, pero ya que estamos muestro las tapas de clarin de los 24 de Marzo desde 1974 al 2013, salvo algunas que sospechosamente no son accesibles. Estas son:

 

Cualquier análisis sobre el contenido, por mencionar alguno, en 1976 se tituló “NUEVO GOBIERNO”, lo dejo para charlas personales. Por último, me encanta la pluma de José Pablo Feinmann, y me encontré con un artículo en la contratapa del Página de 2001 que les recomiendo.

Social Widgets powered by AB-WebLog.com.

Social Widgets powered by AB-WebLog.com.

Social Widgets powered by AB-WebLog.com.