Série d'exercices TD Data Mining
Télécharger PDFUniversité M’hamed Bougara de Boumerdes Faculté des Sciences - Département d’Informatique Module : Data Mining Série d’exercices
Exercice 01: Soit l'ensemble de données présenté dans le tableau suivant : a) Estimer les probabilités conditionnelles pour ��(�������� ⁄ ), ��(�������� ⁄ ), ��(�������� ⁄ ), ��(�������� ⁄ ), ��(�������� ⁄ ), ��(�������� ⁄ ). b) Utilisez l'estimation des probabilités conditionnelles donnée à la question précédente pour prédire l'étiquette de classe pour un échantillon test (A = 0, B = 1, C = 0) en utilisant l'approche naïve de Bayes. c) Estimez les probabilités conditionnelles en utilisant l'approche de Laplace. d) Répétez la partie (b) en utilisant les probabilités conditionnelles données dans la partie (c). e) Comparez les deux méthodes d’estimation des probabilités. Quelle méthode est la meilleure et pourquoi ? Tuples A B C Classe
1 2 3 4 5 6 7 8 9 10
0 0 0 0 0 1 1 1 1 1
0 0 1 1 0 0 0 0 1 0
0 1 1 1 1 1 1 1 1 1
Oui Non Non Non Oui Oui Non Non Oui Oui
Exercice 02: Soit l'ensemble de données présenté dans le tableau suivant : Construire un Classifieur Naive Bayes et l’utiliser pour classifier le nouveau point (T, F, 1). Id ��1 ��2 ��2 Class
1 2 3 4 5 6 7 8 9
T T T F F F F T F
T T F F T T F F T
5 7 8 3 7 4 5 6 1
Y Y N Y N N N Y N