UIUC MOOC TMA W2

Había abandonado las descripciones de los MOOC que he venido tomando.  He tratado de mantener la disciplina en su seguimiento y cumplimiento, pero se me cruzó el examen predoctoral y finalmente no pude aprobar este curso (65% de un 70% requerido para pasarlo, prioridades al final).

Text Mining and Analytics

Un problema con este curso fue que los exámenes sólo permitían un único intento. Todo o nada. Como he mencionado, en otros casos existe la posibilidad de más intentos (en las que las preguntas varían o el orden de las respuestas cambian; algo justo y necesario para mantener el valor del modelo educativo y que no se diga que esto es un mero chiste). Pese al resultado adverso, de cualquier modo, estoy retomando estas descripciones y poniéndome «al corriente». Ya veremos después, si se vuelve a ofrecer, el tomarlo para «sacarnos esta espinita».

En la segunda semana del curso Text Mining Analysis, las video lecturas iniciaron abordando la definición de la tarea y la motivación detrás del del minado de temas (topic mining).

Cómo definir e identificar un tópico y la interpretación de éste como conocimiento que se tiene del mundo. Formalmente se describe la tarea como la identificación de k tópicos sobre un conjunto de n documentos. La idea inicial es bastante simple, identificar términos y cada uno de éstos considerarlo un tópico (entiéndase término=palabra). A partir de aquí se hacen algunas estimaciones sobre la cobertura del tópico en el documento.

Otro tema visto fue sobre la formación de un modelo estadístico del lenguaje en estudio. El más simple es el de los unigramas. Algunos otros son el bayesiano y el de máxima verosimilitud (maximum likelihood).

Otros temas incluyeron:

Deja un comentario

Este sitio utiliza Akismet para reducir el spam. Conoce cómo se procesan los datos de tus comentarios.