Le Data Mining

Le Data Mining

Problèmes et limites

Comme nous l'avons vu précédemment, l'hétérogénéité des données reste un problème puisque cela induit une phase très chrono-phage de préparation.
Le volume des données est parfois difficile à traiter, mais les solutions de calculs distribués (voir l'exposé de Camille Darcy sur le framework Hadoop) se démocratisent et constituent une solution intéressante.
Une autre limite du Data Mining est due au caractère automatique de la production d'un résultat. La réponse apportée par le Data Mining peut parfois être hors scope, voire poser des problèmes éthiques quand on se base sur des données liées aux personnes (des catégorisations de clients sur des critères ethniques, médicaux...etc).
Enfin, avec l'explosion des données personnelles disponibles sur Internet et la puissance du Data Mining, l'utilisation non cadrée de cet outil peut s'avérer être un véritable danger pour la vie privée, comme nous allons le découvrir dans la partie suivante.

Partie suivante