La última semana del curso «Exploratory Data Analysis.» Las lecturas fueron sólo dos, dedicadas a casos de estudios para dar una perspectiva práctica del análisis exploratorio de datos.
La primera lectura se dedicó al análisis de datos obtenidos de un smartphone y la posibilidad de predicción o determinación de ciertas actividades humanas a partir de los datos recolectados por os acelerómetros y giroscopios del dispositivo. El análisis de datos partió del agrupamiento de datos (clustering) para aplicar algunos algoritmos conocidos: Singuar Value Descomposition, finding maximum contributor y K-means.
En la segunda lectura (de 40 minutos de duración), se trabajó el conjunto de datos de monitoreo ambiental de la EPA. Lo útil de la lectura es poder ver la segmentación, manejo y separación de datos a partir de la hipótesis, suposición o pregunta que uno se formula sobre los datos, su origen, sus relaciones y los posibles descubrimientos que uno puede hacer. Aquí es cuando una aprecia las facilidades y potencia de R. La lectura me recordó aquellos días de descubrimiento de AWK.
