Examen data mining master ii 2012 2013

Ce document académique est spécifiquement conçu pour les étudiants de Master II en Informatique, suivant le module de Data Mining à l'Université de Boumerdès.

Il propose un ensemble d'exercices d'évaluation visant à consolider la compréhension et l'application pratique des techniques clés de la fouille de données, notamment :

  • L'extraction des itemsets fréquents et des règles d'association.
  • Les principes et l'interprétation de l'Analyse en Composantes Principales (ACP).

Ce travail constitue une ressource essentielle pour approfondir la maîtrise des méthodes d'analyse de données complexes.

Examen data mining master ii 2012 2013

Examen Data Mining Master II 2012-2013

Télécharger PDF

Examen de Data Mining et Analyse en Composantes Principales (ACP)

Cet examen, datant de l'année universitaire 2012/2013, a été administré à des étudiants de Master II en Data Mining, sous la responsabilité de A. Berrichi, au Département d'Informatique de la Faculté des Sciences de l'Université M'hamed Bouguara de Boumerdes.

  • Nature de l'examen : ETLD
  • Module : Data Mining
  • Filière : Master II
  • Durée : 1h30
  • Documents : Non autorisés
  • Barème : Exercice 1 (10 points), Exercice 2 (10 points)

Exercice 01 : Extraction de Règles d'Association

Le tableau suivant présente un ensemble de transactions effectuées en ligne par des clients. L'ensemble des attributs (items) est R = {A, B, C, D, E}.

ID Transaction Items
t1{A, B, D, E}
t2{B, C, D}
t3{A, B, D, E}
t4{A, C, D, E}
t5{B, C, D, E}
t6{B, D, E}
t7{C, D}
t8{A, B, C, D}
t9{A, D, E}
t10{B, D}

Questions Exercice 01 :

  1. Étant donné le seuil minimum de support min_sup = 0.30, extraire du tableau tous les itemsets fréquents.
  2. Citer et décrire la propriété utilisée pour l'extraction des itemsets fréquents.
  3. Représenter le treillis des itemsets.
  4. Si on fixe l'indice de confiance à min_conf = 60 %, déduire les règles d'association fortes composées seulement de l'article D comme antécédent.
  5. Supposons que la règle : {D} → {B} possède un support de 30 % et un indice de confiance de 70 %. Donner une interprétation.

Exercice 02 : Analyse en Composantes Principales (ACP)

On souhaite extraire des connaissances à partir de données concernant une population composée de 3 catégories d'individus décrits par 8 attributs. L'application de l'ACP normée au tableau des données [catégories individus x attributs] nous permet d'obtenir les renseignements suivants :

Tableau des coordonnées des individus sur les deux premiers axes factoriels :

Individu F1 F2
13.36-0.20
23.52-0.76
???
4-4.280.20
5-1.77-0.80
6-0.88-0.80
70.99-0.40
80.562.36

Valeurs propres de la matrice des corrélations :

Les 3 plus grandes valeurs propres de la matrice des corrélations sont : λ1 = 6.20 ; λ2 = 0.87 ; λ3 = 0.41.

Vecteurs propres associés :

  • U1 = (-0.39, 0.34, -0.34, 0.37, -0.24, -0.36, 0.37, 0.36)
  • U2 = (0.13, 0.44, 0.20, 0.26, 0.74, 0.12, 0.32, -0.05)
  • U3 = (-0.16, -0.32, -0.68, -0.07, 0.56, -0.03, -0.25, 0.16)

Questions Exercice 02 :

  1. À quelle catégorie de méthodes appartient l'ACP ?
  2. Compléter le tableau des coordonnées. Justifier.
  3. Combien de facteurs est-il intéressant de retenir pour l'analyse ?
  4. Faire une représentation simultanée des variables et des individus sur le premier plan factoriel.
  5. Que représente le centre de ce plan par rapport aux catégories d'individus ?
  6. Faire une interprétation dans le premier plan factoriel, en supposant que les variables représentent les consommations de huit produits de consommation courante.

Foire Aux Questions (FAQ) sur le Data Mining et l'ACP

Qu'est-ce qu'un itemset fréquent en Data Mining ?

Un itemset fréquent est un ensemble d'éléments (ou items) qui apparaît ensemble dans un nombre de transactions supérieur ou égal à un seuil de support minimum prédéfini. L'identification de ces itemsets est une étape cruciale pour découvrir des patterns récurrents et générer des règles d'association, souvent utilisée dans l'analyse de panier d'achat.

Quel est le rôle de la confiance dans les règles d'association ?

La confiance mesure la fiabilité d'une règle d'association de la forme X → Y. Elle indique la probabilité conditionnelle qu'une transaction contienne les items de Y, sachant qu'elle contient déjà les items de X. Une confiance élevée suggère une forte corrélation et prédictibilité entre les ensembles d'items.

Pourquoi utilise-t-on l'Analyse en Composantes Principales (ACP) ?

L'ACP est une technique statistique de réduction de dimensionnalité. Elle est utilisée pour transformer un grand ensemble de variables possiblement corrélées en un ensemble plus petit de nouvelles variables non corrélées, appelées composantes principales. L'ACP permet de simplifier la complexité des données, de faciliter la visualisation et d'améliorer les performances de certains algorithmes d'apprentissage automatique en éliminant le bruit et la redondance.

Cela peut vous intéresser :

Partagez vos remarques, questions , propositions d'amélioration ou d'autres cours à ajouter dans notre site

Enregistrer un commentaire (0)
Plus récente Plus ancienne