Le Data Mining
Introduction
Des volumes de données importants
Cette introduction vise à vous présenter un contexte général qui peut expliquer l'intérêt du Data Mining.
Représentation des volumes de données produites chaque minute (2012)
- Toutes les minutes, 48 heures de vidéos uploadées sur YouTube
- Toutes les minutes, 2 000 000 de requêtes de recherche sur Google
- Toutes les minutes, 571 nouveaux sites internet créés dans le monde
- ...etc
Ces informations nous surprennent souvent, il est en effet difficile de se représenter de tels volumes de données. Au-delà de la quantité, il faut noter l'hétérogénéité des natures de ces données (vidéo, images, sons, textes...). Volumes importants et hétérogénéité sont des caractéristiques essentielles des données sur lesquelles on peut être amené à travailler dans le cadre du Data Mining.