La segunda semana del curso Getting and Cleaning Data presentó los aspectos esenciales de extracción de datos desde bases de datos MySQL (remotas o locales), HDF5, la web, API (clásica y obviamente con énfasis en Twitter pero mencionando la posibilidad de aplicar los mismos conceptos con Facebook, Google, GitHub, etc.) y otras fuentes. La presentación estaba enfocada en hacerlo desde R, enfatizando la diversidad de paquetes con que éste paquete cuenta para acceder y procesar diversas fuentes y formatos, entre los que se incluye: Minitab, S, SAS, SPSS, Strata, Systat, Weka, Octave, PostgresSQL, MongoDB, MS Access, MySQL, SQLite, dato sde GIS, formatos de imágenes, música, XML, contraseñas y HTML.
