Traitement Automatique du Langage Naturel avec MALLET

mallet

MALLET est une bilbiothèque JAVA pour traitement statistique des langues naturelles, la classification de document, la classification non-supervisée, le « topic modeling » , le tagging de séquence (Part of Speech), l’extraction d’information et encore d’autres applications sur le traitement et la classification de texte.

Cette bibliothèque a été principalement développé par Andrew McCallum, un des scientifique très renommé dans le domaine de la classification de texte. La version 2.0 de la bibliothèque date de 2008.

 

Making Sense of Data, le nouveau MOOC de Google

Google vient d’annoncer un nouveau MOOC (Cours en ligne ouvert et massif) portant sur l’analyse, la visualisation et la structuration de données. L’enregistrement est possible depuis un peu moins d’une heure à cette adresse : https://datasense.withgoogle.com/course

Les cours auront lieux du 18 mars au 4 Avril 2014 avec la participation d’experts de chez Google dont Amit Deutsch and Joe Hellerstein. Ce MOOC sera certainement le premier pour moi, et sera l’occasion de consolider mon expertise en data mining.