Big Data (3)

CIC Big Data Workshop 2015

El pasado lunes (sip, en pleno día feriado), dio inicio un taller en Big Data en el CIC, impartido por gente de Hungría (un nuevo acento de inglés a reconocer). Vale la pena mencionar alguno hechos alrededor del inicio del curso.

El viernes previo, al notar lo del día feriado, pregunté al personal del área encargada de la coordinación de estas actividades si la fecha estaba bien. Me indicaron que no, era día feriado e iniciaría hasta el martes (mente sindicalizada, no cabe duda). Aún así, se le queda a uno la duda ya que no cualquiera omite un día feriado.

Afortunadamente, decidí darme una vuelta por el centro de investigación el lunes (aunque quería llegar temprano salí tarde de casa) y… ¡voila! lleno de autos el estacionamiento. Al ver que eran las 9:30, si bien ya estaba ahí, no puede evitar recriminarme un poco el no haberme apurado.

En fin. Al ser día feriado, además, los de la PBI se ponen algo quisquillosos y  nerviosos (pareciera que si no es día laboral, consideran que cualquiera que busca entrar a un sitio de trabajo no es alguien «normal» y busca algo más). Ya estoy acostumbrado que pidan registrarse en un cuaderno. Así que apresurado lo hice. El «poli» en turno (nuevo además, no lo había visto) me preguntó si llevaba equipo para que lo registrara en otra lista. Le indiqué que yo tenía pase permanente, y puso cara de «a mí no me dijeron nada de eso» pero yo le puse cara de «y ni se te ocurra dudarlo» por lo que pasé rápido. El retraso no pasó a mayores y procedí a ponerme al tanto lo mejor que pude (a este «poli» me lo encontraría en días posteriores, con otra actitud y llamándome «jefe»; ah.. la naturaleza humana).

En fin, para los húngaros, eso del día feriado mexicano les valió (lo que no estuvo mal) pero les faltó comunicación con los burócratas del IPN.

Lo primero era hacerse de la máquina virtual. 3.5GB que, por un «ruidoso enlace wi-fi» es tardado. Pasaron las tres horas de la sesión y no terminaba de bajar.

La sesión se dedicó a revisar algunos conceptos de Big Data y la tecnología de Hadoop. Se describieron también algunos elementos de la configuración a efectuar en el entorno de la VM y herramientas que el entorno proveía, entre ellos el IDE IntelliJ de IDEA, ya que éste, a según de la opinión de los expositores proveía un mejor soporte para Scala.

Al parecer el software de VirtualBox tiene algún detalle al manejar sus propios archivos, ya que marcaba la corrupción del archivo de la máquina virtual al tratar de importarla. Los expositores indicaron darían instrucciones por correo sobre cómo manejar este problema.

Al final de la sesión, con la máquina que tengo en el laboratorio me tomó sólo cinco minutos hacerlo (más otros 5 que me tomó hacerme de algo para ello, ya que el Windows no incluye una utilería para transferencias por SFTP. Así que del mismo lugar de donde conseguí al PuTTY, descargué el pscp.exe y de ahí, con el comando:

c:\>pscp hduser@148.204.66.42:hadoop2x-debian7-updated.ova .

proporcioné el password dado en el curso cuando lo solicitó la transferencia, y listo.

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.