Estoy en la segunda semana del curso de Cluster Analysis in Data Mining. El curso es enteramente teórico y Jiawei Han habla demasiado leeeennnnttttooo. Está pesado el curso. Imposible que a uno no le gane el sueño… más cuando uno toma estos cursos por la noche. Debo cambiar mi esquema de trabajo y tratar de tomar esta video lecturas en un horario en el que esté mucho más despierto.
La primera parte de las lecturas de esta semana están dedicadas a revisar el concepto del agrupamiento jerárquico (hierarchical clustering) y sus algoritmos, lo que comprendió:
- Algoritmos aglomerativos
- Algoritmos de separación (divisive)
- Extensiones al concepto de agrupamiento jerárquico
- El Algoritmo BIRCH.
- El algoritmo CURE
- El algoritmo CHAMALEON
- Agrupamiento jerárquico probabilístico
La segunda parte estuvo dedicada a métodos basados en densidad y en malla (grid), que en esencia es tomar valores de proximidad y localidad como elementos de decisión de agrupammiento
La tercera parte de las video lecturas se dedicó a los modelos probabilísticos, esencialmente basado en procesos generativos, como lo es la típica distribución gaussiana:

