Tercer semana del curso Cloud Computing en Coursera, ofrecido por la University of Illinois at Urbana-Champaign. Este post lo escribo una semana antes de publicarse. Como señalaba en el post previo, ya me he puesto al corriente en este registro, aunque la publicación está siendo diferida y programada con otros posts retrasados.
La tercer semana de este MOOC tuvo lecturas (13 esta vez) sobre los aspectos del cloud computing enfocado al procesamiento en tiempo real (real-time processing) de flujos de datos, común y mundanamente conocido como streaming. Se mencionaron (Twitter Heron, Apache Flink y Apache Storm) las arquitecturas para cómputo en la nube orientadas a este aspecto de procesamiento, ya que Hadoop no está pensado para esto, aunque ha permitido servir de base para ello. Las lecturas se enfocaron en la descripción de Apache Storm (arquitectura, componentes, desarrollo… todo a nivel introductorio… o menos que eso, ya que estas cosas son complejas y enormes como para sesiones de 30 minutos o menos, y el curso no está enfocado al estudio de estos mecanismos específicamente sino a la utilización de éstos) el cual está desarrollado en Clojure y C (esto por cierto me trajo a la mente el caso de Wal*Mart del que hace poco escribía, y ahora queda entendido el porqué de la decisión y el éxito del asunto).
Los videos incluyeron varias entrevistas y exposiciones de dos ingenieros de Yahoo! que están muy involucrados en la infraestructura tecnológica empleada por la empresa. Sorprende que Yahoo! tome proyectos open source para su operación, y que los enriquezca en retribución.

