Exercices td apprentissage automatique data mining

Exercices TD Apprentissage Automatique Data mining

Télécharger PDF

DATE 0816012024 T DO 1 U DM.TO NOTES Rappall! IA X ML DL هه Observation Je Cible.. La relation xety Apprent: sage Automatique MLG DM. (Applence à partire des donnés, DL (Apprenti sage profond humain Is inspire the cerveau huur aan دیا (2sx de newrammes) caché Voir in comme) on utilise M1 Séveol des tâches de DM Prédective (Superwink) l'hem clarific) La variable cible (y) est disponible Classification Descriptive (now supervise). pas de Variable cible. (JA nege Regresion Detection séquitations Régle des aurnalis L'obsein Exercice of ! a non B. nou 6. non d non e. Quu foui (SQL) (calcule) (EXL) Jour (Fuda) (sequentation) (régrétion / Bro Anomalia) (1) non I. Qui MA Qui (Régation) (classification) W nou (TDG) noui | Régression) (Proba) h-now- B non (Statistique) H Scanné avec DATE 1 Auster 12 Chun い Nominal cluster 1 C DR.TD. vurimble Qualikali pe Ecatigonale (fin)) poséde La même importance (pas 'crotze) (couleurs. NOTES projet Cape,Ca) of scant pustilo. Gantire, wfm) Intervale Ordioral. 31kg 20 4 Der Graala biem aéfini Bk13 Das ff. exp: Taux de Sutisfaction, & (Faible, Moyen) Ration. O n'est pas absolu (ga siquifie pas ↑ contain an awr expirempérature, Année Jossbluce de phénoméne Interval O Abfence le phénoméne exp: Taille poid) Scanné avec DATE 15/10/24 DM. JD NOTES IDOL Exercice od! a Binaire Catégorielle, Nominal, b. contin (Ratio) 20 lumière Brativo.) → 0 Sighingie l'absence to lunc 10 c I faible, may, forte & Discrite Grantitatif d countime quantitative Patio => E. DiRcrite - Quantitative oralinal f. centime Quantitative Intervalle une → Quant, tative F conti мне Ratio Dis crite you antitative => Nominale Discrite> H -> Nominale →→ Ordinate => Ratio I 手 j- Discripe ->> 4 => Ratio K + Continue> b contime> A Discrete

Exercice 03

4 => Nominale Taches de DM. Supervisé (predective) Now Super Rise (Descriplice Variable Sible Chassification ↓ "I perection segmentation Regles (Contima) (cateéforingle) Régression des anomalie (clustering) d'associati → AB. 32A1 Age <ds et Salaire Wok conduire us Regle de Régrestion By classificatio Voiture de Spart al 80% content une voiture contient une 15 ip Regle & seguetaticen dosić Scanné avec DATE DM-ID. F/ classification onifer Détection d'anomalie 3.4. X classique. I ngemeur rédige un NOTE y Auto Supervise L prof apprend à esch don't tous les les régles d'une façon Code qui régles possibles. Manuel Leut PRG + EMAIL auton omne Automatique Rapido Spont Spewn fou Email tou Nou поибрале Spand Scanné avec DATE 1 Arbore de décisions DA. ID. NOTES e Techinque de ML supervisée (Num parat é Krique) clasification et Régression. structure hiérarchique (Saut forme d'un arbre) qui représente les résultats en were série ele choix. interconectes. Exp: Les survivant du Titanic. Genre 11 Mort -2 construire l'arbre à travers des algorithme Enfant And Degution Clally ficatioen Ош Now Tree [CART Swwew Age 240 | Nom Te génie le plus faible Maximise l'information Survécu mesure la paurtik GINI (S)-1-&P,2 2 The Lower The Better "=" Scanné avec to adds ป DM-TD. So ke od lo 310(0) 10(4) DATE 21 / 4D T Do3. Exinca 1). Q-G11m (() = A 11- ID client. JD.client. (( 10 )2 + ( 20 ) 2) = 1/2 20 ID. Grini (5D-1)-1-(12 +0) ID- Gimi (ID 20). 0 5.) Valeur (exerze) = {μ, F{ 4 104 کے V 2 NOTE Gini ( Gewre - M) = 1 - ((4)2 + (18/00)2)=0+ 4-g Gine (Geure of) = 1-((%)2 + (4/10) 2)=0, 48. Gimi (Gene): 10/2001 48+ 20,48 -10% 0.148 cle M & 4 Вто тебе J/ Valeur (Type Voiture) = (Sport fragilial, hore) 83 3 9 نکه =0,378 Gun (Type = Sport) = += ((2)2 + 12 ) = ( Gini (frype. Pamille) = 1-(13) 2 (1/2)27) 20,576 1-11318 "Gini (Type-luxe)-1-(148)2 + (7/8)) =0, 2188. Gini (Type) = 8/ 20 x 0 + 4/20 × 01376+ 8/2 +0, 2488 8/20 X0 =0,16√√2 X et valeur (Taille) - 5 (5), M(7), L(W) x 2 (4) { LV Bu q p b b y 19 んえん l 13/8+)20148. Gini ( Taille_s) + 1- ((2/5) 2 (12/8)2 + (3/8 ) ) = 0,4p. Gini (Taille-1)=d- Gini (taille ()-1-(( 2/41)2 + (2/4)2)=015 ((4/7) 4 (3/2)2)= 0.4 ggt Scanné avec DATE Copier (Touille -X2) (aph (Taille) 014914 DM. ID NOTES = 1 - (@/μ)2 + (3/4)2 )=0.5 Броканда 12+ coing + 7/pololip 12 14 185 120 Укокот f-gen le millewn attribut est : "Type de voitur car il a obtenu la valeur La / pleifenbl) 2. 230 client est une clé primaite Munique et pon pas une caractéristique. L'utilisation de cet attribut entraîne in suor apprentissage car on peut par classifier un nouveau client Rappel jeux de Données (SA). Entropy(s). Gain (SIA). Jiem Supo

Exercice 03

info Ve valeur (1) Tafak کے Higher Bette ISGT Entropy to Entropy (A)= [Eploge PD+ & log (10) a) Entropy (5)= [ & log (4/8) + 5/9 lg 2 (5/9)] = 0,99 41. b/ Gain d'Information de 1.1. As valausn = 2T, FE انت 3 A 4 Entropy (A4 = T)= [3/4 log + (3/4) = 1/4 log 2 (4)] 0.8812 -Entropy (As) ==[uplog (Ve) + 4/ Log, ye]. (A125 1 =066987 Gaw ( 5, 14) = 0, 9911 + 4/8 x 01 8812 + 1/9 * 0165g 97 ] = 0,2294 Scanné avec DATE 8 / 10 / 2024 DM TD b/2. Gain d'information de A 2. NOTES Entropy (S)=(P+ Log & P+P Loga ?_) Gain (S,A) = Eatropy (6) YΣ 15 vi Entropy lay) آذر Jeu de données VG valeur (A) Valeur (A2) = (I.FF Entropy (A2+) = (2 loge / 4) +21 Love (3) t 14 or Entropy (A2 = F) = 10+ (3% log (21) 24 (log(2/2)) = Gain (SIA2) = 0, 99 11 - (4/2018 709 + 4/8/1) = 0,0072 Ci Attribut Az 6 az 2 3 7 Chasse Divissien Entropy (s) = 0,39 11. Cas 1:25 (senil) Entropy (Az<L16)=0 人 + X 215=0,1427 $18t + 8 ↑ N + 315 2010026 Entropy (A-37615) #4/plogs/st 3 215=010072 5.5=010183 38 log 7/8 gy 095214 SELY ( 6.6-0.1022 120 3.11 - 1 1/4x0 + 88x0, 3544) Grain (d, #3=215). 41 9 (1/gx0+ 7.5. 011427 = 0,1427. • віджат 1 la valeur final. Grain (S., Az) = 0, 1427 d) la milleur division ostemme par As, car, c'est l'oult ribut qui a eu le gains le plus élevé 4/ misclassification error rate TA1 K ++ 1/21 A1F + ALF ++ ++ milleur Divisirens Nest As पर 45 2/41 4/9 Scanné avec DATE f + Gini NOTES Gin (A1 = 1) = 1 - (( 3/41 ) 2 + (1/1⁄2 )2 ) = 1/21 = 6375. -Gmi (241 = F ) = 1 - (4/5)2 + (4/7)2 ) = 0,82+ Gini (AA) = 4/9 x 0,3 7 5 + 5/9 x 0,3 2 = 0, 3444 Gini (142 = 1) = 1 - ((22 +(3/5)2)=0,48 198 Gine (A2 = F)-1-((2/4)2 + (2/4) = -0,5 Qui (A+) = 5/gx0148+4/9 2015=0,488888. I attribut As offre la milleur division en utellisart l'indice de Gini (lower, beltes) Exercio ob Algorithms de Hunt Technique glowtonne plume Haut de construir unazbou. condition d'arrêt med. Purtée maximale (Tous les enregistrements appartiennent à la m clatte. Condition D'anit n = & Tous les enregistrement n=& portent la même valeur. Creuse H Geme Age Present H/25/ Oui 14 25 очеі Blon f It oui Qui F ro он 44 21 out F 23 our Scanné avec DATE is 2024 Extrace of Ch. (: Iterative Dichomise. DM. TID. NOTES Procédure #lagagée limiration de la profeulem • Supporte les valeurs !?" Contime et uncounces. Pondération des attributs X Wrx Gemz wz, Aage.. Exercice of. version plus Septalling Con soun me mains he Mémoire.. Appligne des algorit plus évoluées Commercial Arbre genere est plus optional overfitting the (pabre) s'ay uste trop. aux données le modele s'ajuste d'apprenti sogle Validation viopment / Text pour 0.0% validation avec l'appren détecté lover Neend & 1 échentrillou th comme ID client Profendeur accrue (Division exersive) Apprentisage de buit. Identification.. Performance élevé dous le Jeu de données d'entraine; " faible 114 "I'll devalidation et Test Exercice of! Application de Pre Puning Post-Preming Ratuer Selection Application de selectiones l'élagage lour de l'élagage aptés (Seulement la Coust-cuction de l'arbre la Const-cuction les affrer buts de l'arlow les plus Siquificati ofe Scanné avec DATE / 1 DM TD Elagage supplimer noeuds Branches qui ne con torentout pas Exerc QoS. NOTES à une amélioration des performance. ·Prule port Drumming = Ex07 Be dunce error plussing chaque farmille ext remplacée par la classe majorative (ie, Laplas fre quante) Si les plorformance ne se dégagent pas on concerve changement. Ce Scanné avec -2 DATE 26 / 5 / 2024 alle est: ML DM. TD Régréshon vindu Prédictive Régrémon [ Contime) NOTES Parcane ty 1. Pré size our variable y C. de prendrente) via_ une Variable un tépendante (x) Sous forme he(x) = Go + D + x = 7 fet affine → hotx) minimises Ponition de cout. Joey) +12 ((hose 1-y1)) 2m La somme des écarts I dentifier les valeurs optimale te & it on. Audient Descente et ~@ Analytique. (Aproximation! Exos et Exo2

Exercice 1

Sériecz Exoz et 4 F(x) = 1·2(x-2)2 དགའ་བའི་རྒྱུ་བ་,་”)རིམ་ནས་ +32 en valeur de x my nimise la firme F(2) = 3,2 P(0)= 0 Graphe 44gene 3 4 F(x)=2,4(x-2)=0. 2 of est convexc W non-convex Scanné avec DATE -/ / WH-TD. NOTES AFCO) or 1). Répéter 10. O. & d F (O) ( jusqu con Vergance.. Tand d apprentissage (he thing rate) il contrôle los pas contrôle la vitesse (Lo d'appanti sacrofe Lachistance de/ a/. solution of: le gradiant est null offo no pour cela, it font fixer un semit solution of Starbritisation de La fronction deconte 0.2. càd: J(0); + Jo(0) 11 = 0 b/- valeur initial &= 0, 1 La Valeur de α=0,6 0:00.6 (2.410-2)) 0-1, 44 (0-2). Ө F(0) Itération o 0.1 -4156 1,83 Itération 12, B6 2,0064 410038 11 2463. 0882 3.231 1/ 3 216 0.3884 3,206 1 21 1.92 52.01 97904 3,201 0,1709 3,20oft 20042 Le 11 be town mataire: ou début de l'apprentissage (a function gluére des valeurs Glevées à cause de l'in salisation aléatoire de parâmétre, durant cette phase le modèle se caraptéruse par des performance médioca pendent I apprentissage la fonc. commana a aliminée graduelement grace à l'ajustement des paramúke. A la fin de l'apprentissage on constate ca stabilisation Scanné avec DATE 02/12/20244 DM TD de la fone du cont indiquant l'attente de la comfiguration Istimall- Exercia 02: J = Po + Of x i = b (xi) NOTES But de l'apprentissage : minimiser la fonction de coût:: En utilisant La descenti de Grament: Mean Squared Erreur. 1 1 (he(x) 2 Im & (halxy-fitz M Lin ind Float Repeter ஆ0.. ஆ. = 1 $5 J ஆ -Dox (1/2 (00 + Dexi do Ө dJ x SI-A atki (dovers-Y; To & Jusqu'a convergence

Exercice 03

methode Analytique & merindre corre xasy X comporte une seul caractéristiqu F: La moyenne de visite دیر O1 = x2 - x Y x 2 -(x)2 12 nbcz X ху хуту 21 23 4 46 2314 Q = 330,41 -(8x36) 8482 (8x36)=2,12 3 27 9 8.1 εší $ 28 25 14.0 29.64 ན(རྟ) ལ་ ཊིཤ2;N 1༽,p 8=36=(21?2)x8-19, 04 д 20 39 81 264 38, 12 39 100 390 4021 8/36 181 180 12 25 144 349 4443 4 on 2683984 7675984 Scanné avec DATE DM-TD. La qualité de l'ajustement NOTES to est fait pour le coefficient de détermination - R2 A 1 mar Σ (Ji-Ji) 2 Ž د the higher The beyler 2 1_ (23-23,28)2 + (27 2 (14)2+ (28-29.64) +(35-38,12) +(39402) (uf-44148)2 + (51-501841 ( &3 - 36 )2 + (27 - 36) + (28-361424(35-36)2 (48-36)2 +(31-3612 =40,0064 + dis6 +216896+0,7744 + 114641+91 2704 169 +81+64 +18+81 + £25. 22-0,9878.

Exercice 041

Régression Linaire multiple: Chapne colonne +0,0256 to X4,1 1 イ - पैल to 01 Oo+0xxt 1: = Ө 1 Ви - Oo Dixit + Onay = JE. # کے е 5(0) = 1 1⁄2 (Y: -Yo) (gige) e =0· On A $5.0 to 79_1x0-Y) (XO-Y) (Levon) ete Itotxo por vixo-yty. Scanné avec اد DATE 1 NOTES on ve dirivé dI do ona J= 02x2x 20x3y.yty. 好 サ "dawx & x x0 = 2x+y= done xxo-xty (x2+ x)^~^ ( x + x) σ = (x + x)" x 3y. 8 = (x ^ x ) = 1 x ^^ = 69 Scanné avec DATE /12/ ly DM-70 Séke oh! NOTES Régression hogistique: & classification chassification binaire. Is Activation function (signerd.) (fonction d'activation) → fonction be cast (Prinary Gross Entropy) Q1: Exemples de problemes de la classification inacze Is Spam | Non Spewn Fatanic dataxt (White/ Dead). Is chat and chauth chassification multiple: - Type d'attaque en réseau (ODOS, MAN in the middle...) -Classification des sentiments (Positif, Négatif, Mente) MNIST Dataset (Reconnaissance des chiffres manuscrit IRIS Dataset (- Classification des fleurs). Q2: In Lifference. • Qui, la différance réside dans la manière dont la valeur pratite sera interprétée. m -> En termes de performances, c'est la in +YE 2-1,14 indique que y peut voir seulement deux valeurs possible. 1 pour la classe négative et + 1 pour la classe positive. £3: la fonction d'activation sigmoid G(Z) = 1 4+C-2 Z Oax O1 x les Roles: Transformer la valeur en proba VETO, it 1 - in Fotwire the mon-hinfarite garantire que toutes les clatte Ion la même importance Scanné avec DATE DM-TD NOTES 24 que represente hive): te prober one l'ooservation x appartiennes la classe positif. A=hp(x) = 11 77 11 # 11 11 21 1/ ~ négatif. 14=0 span et y = 1 No Spam). ety he(x)0, to est la proba que l'observation x a la dresse Spam à 10%, et SpAnazo, email appartien → Get email ser considéré comme un Now Spens. notre modèle (scent à (0%). par Convexa A non convexe onesolution. multiple Solution one is -) optim l'utilisation de la fonction du coût (Erreur quiandratione Mogemme) dans un probleme de chassification avec la fonction Si-groid genère un graphe 'nou convexe. Pan Cosequent содерен Untilication de cette derniere in assure par l'abstart, des performances cephi abes. tre 23/201 Q6: J(0)=1/3 test (ho(xi); f1) telle que: 11 Justifian Cost (ho (xi), Ji). Л La courbe est carvere J. -Yiss Hos 21st 20 Ynd homso wsto. 1 (i) by The(xi) Y;= 3_log (1-ha(ki) g1 Lino. Y1 20 WW) 10 Wato Ціго случа AustrD+2 Scanné avec DATE DM-ID. NOTES la poruction cost produit des valeurs élevels pousies mankind prediction et des valeurs faibles Cestermes pedictions "conclusion, cette fonction, est idéale pour traiter un probleme de la classificato un benaire food. Recouve lette fonction d'une façon compacte (ook (ho-(xi), y;) == (Yihy (hip (x)) + ff-y) log (1_halk.) Q6: Brontière de técisions -18/12/24. blank Sigmoid 6.1 1 Globule range AX1 6(2)=1/2 120 12 =P -= ( 0 0 + 0 1 1 1 + O 2 X 2 ) Z 4+e -e-z-1 mez = m1 Z 1 о 9,24=-2, - 92 x2 2400 92 x2 Os + MA= 2 -Ky 1 Gizi prédicticen ho(2, 24, 22=3)= Q2 x + = 1, x 53 Ол 2 3 A 1+2+1+3 =0.886 Scanné avec DATE 1 071 DH.TD NOTES Data augmentation c'est l'entenbole de té chem qui premetemt de dévéres des données Syntethétiser (artificiele ) en se besont downer excis burte la grami Section (08) futur selations. Op: ponctuer de régulier sat in J(O)- cost (gy)+ dz - 感 ¿ c'est une technique qui fotmat de regularnetes (contrôles) Les valeurs affecter aux paramétre. the les n'adet pas des valeurs trés clark autrement dit elle assurd Ass Buble pus 오 aigutisti averfaty [28.10.6) Laigularisation podelíme verfic Scanné avec

Partagez vos remarques, questions ou propositions d'amélioration ici...

Enregistrer un commentaire (0)
Plus récente Plus ancienne

Publicité 1

Publicité 2