Examen de Rattrapage Data Mining
Télécharger PDFUMBBoumerdes- Faculté des Sciences Département d'Informatique Examen de Rattrapage Data Mining Barême: Questions (10 points), Exercice (10 points) 1. On veut construire un système de détection d'intrusion dans les réseaux. Quelles sont les tâches de Data Mining pouvant jouer un rôle pour l'efficacité d'un tel système? 2. Donnez un exemple d'application de la tâche de classification, le modèle de représentation des connaissances extraites et la technique (ou les techniques) applicable(s) à la tâche Correspondante. 3. Récrire l'algorithme de la descente du gradient en spécifiant tous ses paramètres. 4. Supposons que nous utilisions la descente de gradient pour essayer de minimiser une fonction quelconque f(0,0,) en fonction de 90 et 91. Parmi les affirmations suivantes, lesquelles sont vraies ? valeurs. A. Si oet 0, sont initialisés au minimum global, alors une itération ne changera pas leurs B. Fixer un taux d'apprentissage très faible n'est pas nocif, et ne peut qu'accélérer la convergence de la descente de gradient. C. Peu importe comment o et 0, sont initialisés, tant que le taux d'apprentissage est suffisamment petit, on peut s'attendre à ce que la descente de gradient converge vers la même solution. D. Si les premières itérations de descente de gradient provoquent une augmentation de f (60,01) plutôt qu'une diminution, la cause la plus probable est que nous avons défini une valeur du taux d'apprentissage trop élevée. 5. Supposons que pour un problème de régression linéaire, on a réussi à trouver certaines valeurs de 60 et 91 telle que la fonction coût 1(00,01) = 0. Lesquelles des affirmations ci- dessous sont vraies? (Cochez tout ce qui s'applique.) A. La descente de gradient est susceptible de rester bloquée à un minimum local et de ne pas trouver le minimum global. B. Pour que cela soit vrai, nous devons avoir 00 = 0 et e1 = 0 de sorte que he (x) = 0. C. Pour que cela soit vrai, nous devons avoir y() = 0 pour chaque valeur de i = 1, 2,...,m. D. Notre ensemble d'apprentissage peut être parfaitement ajusté par une ligne droite, c'est-à-dire que tous nos exemples d'apprentissage reposent parfaitement sur une ligne droite. EXERCICE: Un site web de vente en ligne propose entre autres des Livres. En effectuant une recherche sur un livre particulier, il vous affiche les livres qui sont fréquemment achetés ensemble avec le livre recherché. 1. Quelle est la tâche de data mining la plus appropriée utilisée par le site Web pour nous livrer cette information. 2. Sur la base des transactions portant sur les achats des livres, donnés dans Trans. Livres le tableau ci-contre, extraire tous les ensembles de livres fréquemment achetés ensemble (min_sup 2 ou 2/9). 3. Quel est le nombre maximum de règles d'association qu'on peut extraire T4 de cette base de transactions? T1 L2, L4 T2 L1, L2, L3 T3 L1, L2, L5 L2, L3 T5 L1, L2, L4 T6 L1, L3 L2, L3 T8 L1, L2, L3, L5 T9 L1, L3 Bon Travail. 4. Déduire les règles d'association fortes (min_conf = 70%) composées de T7 deux items comme antécédent et un item comme conséquence. 5. Interpréter l'une des règles découvertes. intel CORE