Hace tiempo recopilaba algunas fuentes de datos libremente accesibles. Recientemente, a través del blog de Revolution Analytics supe de la existencia de un repositorio llamada DataMarket y de un paquete de R asociado, rdatamarket.

Un ejemplo sencillo: el conjunto “1loo” proporciona medias mensuales de temperatura de más de 500 estaciones repartidas por todo el mundo:

library(rdatamarket)
dminfo('1loo')

Para obtener los datos en formato zoo de dos estaciones cualquiera usamos:

tempDataMarket <- dmseries('1loo', "Weather station"=c("Madrid", "Sonnblick"))
xyplot(tempDataMarket, superpose=TRUE)