Série d'exercices TD1 Data Mining
Télécharger PDFUniversité M’hamed Bouguara de Boumerdes Faculté des Sciences - Département d’Informatique SERIE D’EXERCICES N° 01 EXERCICE 01 1.1Discuter si oui ou non chacune des activités suivantes est une tâche de Data Mining. (a) Répartition les clients d'une entreprise en fonction de leur état civil (marié, etc). (b) Diviser les clients d'une entreprise en fonction de leur rentabilité. (c) Calcul des ventes saisonnières d'une entreprise. (d) Une base de données des étudiants Triée sur la base des numéros d'identification. (e) Prévoir le résultat de jet d’une paire de dés (équitables). (f) Identifier des groupes de documents ayant un sujet similaire (g) Contrôler la fréquence (le rythme) cardiaque d'un patient pour des anomalies. (h) Identifier en quelle langue un texte est écrit. (i) Calculer les fréquences d'une onde sonore. (j) Prévoir le prix des actions d'une entreprise dans le futur à l'aide de l’historique des données. (k) Déterminer le chemin le plus court entre deux nœuds dans un graphe. (l) Prédire le nombre de vélos à mettre en location à chaque station d’un système de location de vélos citadins. (m) Identifier l’expression d’un visage parmi une liste prédéfinie de possibilités (colère, tristesse, joie, etc.). (n) Évaluer le prix qu’un tableau de maître pourra atteindre lors d’une vente aux enchères. EXERCICE 02 2.1 Classer chacun des attributs suivants comme binaire, discret ou continu. Aussi les classer comme qualitatif (nominal ou ordinal) ou quantitatif (intervalle ou ratio). Certains cas peuvent avoir plus d'une interprétation. Exemple: âge en années. Réponse: discret, quantitatif, ratio. (a) Le temps en termes de AM ou PM. (b) La luminosité mesurée par un photomètre. (c) La luminosité mesurée par les jugements des gens. (d) Angles mesurée en degrés entre 0 et 360. (e) Les médailles de Bronze, d’argent, et d’or telles que décernées lors des Jeux olympiques. (f) Hauteur au-dessus du niveau des mers.
(g) Nombre de patients dans un hôpital. (h) Les numéros ISBN (International Standard Book Number) pour les livres. (i) La capacité à laisser passer la lumière en termes de valeurs suivantes: opaque, translucide, transparent. (j) Un grade militaire. (k) La distance du centre du campus. (l) Densité d'une substance en grammes par centimètre cube. (m) Le numéro de vestiaire. (Lorsque vous assistez à un événement, vous pouvez souvent donner votre manteau à quelqu'un qui, à son tour, vous donne un numéro que vous pouvez utiliser pour demander votre manteau lorsque vous quittez). 2.2Quels AUTRES TYPES de données sont susceptibles d’être traités par les techniques de data mining ? EXERCICE 3 3.1. Quelle est la différence entre un programme classique et un programme d’apprentissage automatique supervisé ? 3.2. Déterminer quelle est la tâche de DM ayant permis d’extraire et de découvrir les modèles suivants : A. Les personnes ayant moins de 25 ans et le salaire> 40K conduisent des voitures de sport. B. Ensemble des images qui contiennent une voiture comme un objet. C. 80% des images contenant une voiture comme un objet contiennent aussi un ciel bleu. D. 98% des personnes qui achètent des couches achètent aussi de la nourriture pour bébés. E. Des abonnés de téléphone de domicile pour une société de télécommunications, avec une activité commerciale à la maison. F. Des radiographies numériques des poumons, avec des taches suspectes. EXERCICE 4 Une compagnie de Téléphonie mobile a un problème commercial lié à la perte croissante de ses clients (Attrition ou Churn en Anglais) : les clients abonnés annulent leur abonnement pour rejoindre un concurrent. Quelles sont les façons dont la Data Mining pourrait être utilisée pour résoudre ce problème commercial. Comment l'utilisation du modèle aidera à résoudre le problème commercial initial.