Chapitre4 les ontologies prolog ai - intelligence artificiel

Intelligence Artificielle AI - Prolog : Chapitre4 Les ontologies prolog AI

Introduction à l’Intelligence Artificielle

Mélanie COURTINE

Qu’est-ce qu’une Ontologie ?

Une ontologie est une spécification explicite d’une conceptualisation [Gruber]. Elle se compose d’un vocabulaire et de la signification des termes de ce vocabulaire. Une ontologie permet une compréhension commune et un consensus, favorisant ainsi le partage et la réutilisation des connaissances.

Les applications incluent les systèmes multi-agents, l’intégration de bases de données, la recherche d’information intelligente et le Web sémantique.

Exemple 1 : Ontologie des vins

Voici une structure d’ontologie pour les vins de la région Bourgogne :

Bourgogne-region (Chose)
Wine-region (Chose)
French-region (Chose)
Bordeaux-region (Chose)
Consomable-thing (Chose)
Wine-property (Propriété)
Potable-liquid (Liquide potable)
Wine-color (Couleur du vin)
White-wine (Vin blanc)
Bordeaux Pauillac (Région)
Red-bordeaux (Vin rouge de Bordeaux)
Beaujolais (Région)
Medoc (Région)
White-bordeaux (Vin blanc de Bordeaux)
Chian (Vin de table)
Table-wine (Vin de table)
Margaux (Région)
Red-table-wine (Vin rouge de table)
Wine-body (Corps du vin)
Italian-wine (Vin italien)

Thésaurus ≈ Ontologie

Un thésaurus est un outil utilisé en recherche documentaire pour organiser les termes d’un domaine. Il permet de définir des relations entre concepts, pays, régions, etc.

Les relations sémantiques incluent :

hiérarchiques (générique/spécifique : relation ISA)
de synonymie
de voisinage (Voir aussi)

Exemple :

ISA : Concept → Pays → Région
SYN : Grande-Bretagne → Royaume-Uni
VOISIN : Grande-Bretagne → Voir aussi Perfide Albion

Les règles d’association

Les règles d’association visent à découvrir des relations, associations ou corrélations intéressantes dans un grand ensemble de données.

Applications courantes :

Analyse du panier d’un client en grande distribution
Identification des groupes ou ensembles de produits fréquemment achetés ensemble
Optimisation de la disposition des produits à l’étalage

Exemple : Lorsqu’un client achète du lait, achète-t-il aussi du pain ? Avec quelle fréquence ?

Mesures : Support et Confiance

Pour évaluer une règle d’association, on utilise deux mesures principales : le support et la confiance.

Soient A et B deux sous-ensembles d’items, une règle d’association est une implication de la forme A ⇒ B.

Le support (s) d’une règle A ⇒ B est la probabilité qu’une transaction contienne A et B ensemble.

La confiance (c) d’une règle A ⇒ B est la probabilité conditionnelle qu’une transaction contenant A contienne aussi B.

Exemple de calcul

Transations : ensemble O = {1, 2, 3, 4, 5, 6, 7}. Items : ensemble A = {a, b, c, d, e, f, g}.

Support(a ⇒ b) = 6/7, Confiance(a ⇒ b) = 6/7
Support(b ⇒ c) = 5/7, Confiance(b ⇒ c) = 5/6
Support(g ⇒ h) = 1/7, Confiance(g ⇒ h) = 1/3
Support(h ⇒ g) = 1/7, Confiance(h ⇒ g) = 1/2

Les k plus proches voisins

Les k plus proches voisins est une méthode d’apprentissage non supervisé utilisée pour la classification.

Principe :

On dispose d’une base de données d’apprentissage constituée de couples « entrée-sortie ».
Pour estimer la sortie associée à une nouvelle entrée X, on prend en compte les k échantillons d’apprentissage dont l’entrée est la plus proche de X.
On utilise une distance à définir pour mesurer la proximité entre les entrées.
Exemple : Dans un problème de classification, on rendra la classe la plus représentée parmi les k sorties associées aux k entrées les plus proches de X.

L’algorithme

Paramètres : le nombre k de voisins.

Données : un échantillon de m exemples et leurs classes.

La classe d’un exemple X est notée c(X).

Entrée : un enregistrement Y.

Étapes :

Déterminer les k plus proches exemples de Y en calculant les distances.
Combiner les classes de ces k exemples en une classe c.
Sortie : la classe de Y est c(Y) = c.

Exemple de mise en œuvre

Base de données : (Dupont, Admis), (Fernand, Admis), (David, Ajourné), (Dumont, Ajourné), (Billaut, Admis).

Notes des étudiants :

Dupont : 14, 12, 8, 12
Fernand : 12, 12, 6, 10
David : 8, 9, 9, 1
Dumont : 15, 11, 3, 5
Billaut : 12, 9, 14, 11

Nouvelle entrée : Verneuil avec les notes 9, 14, 15, 6.

Distance utilisée : Racine carrée de la somme des valeurs absolues des différences entre les notes.

Avec k = 2, la classe de Verneuil est déterminée en fonction des deux étudiants les plus proches.

Réseaux de neurones

Les réseaux de neurones artificiels sont des systèmes inspirés du fonctionnement du cerveau humain, composés de neurones artificiels fortement connectés. Chaque neurone calcule une sortie unique en fonction des informations qu’il reçoit.

Définition et fonctionnement

Un neurone artificiel est défini par :

Une fonction d’activation (ou de transfert), T.
Un nombre entier d’entrées, n.
n + 1 paramètres numériques : n poids synaptiques et un seuil (ou biais).

La formule de calcul pour un neurone à n entrées est :

f(x₁, ..., xₙ) = T(∑(wᵢxᵢ) + b), où wᵢ sont les poids, b le biais et T la fonction d’activation.

Applications des réseaux de neurones

Les réseaux de neurones artificiels sont utilisés pour résoudre des problèmes complexes, notamment ceux où le cerveau humain excelle mais où les ordinateurs ont des difficultés, comme :

Certaines tâches inversées.
Le changement de contexte.

FAQ

Quelle est la différence entre un thésaurus et une ontologie ?

Un thésaurus organise des termes du domaine avec des relations hiérarchiques, de synonymie et de voisinage, tandis qu’une ontologie inclut aussi des définitions formelles et des relations plus complexes comme "culte" ou "exporte".

Comment fonctionne l’algorithme des k plus proches voisins ?

Il classe une nouvelle entrée en fonction des k entrées les plus proches dans une base de données d’apprentissage, en utilisant une distance définie. La classe majoritaire parmi ces k voisins est attribuée à la nouvelle entrée.

Qu’est-ce qu’un perceptron ?

Un perceptron est un type de réseau de neurones où les cellules de sortie évaluent l’intensité de la somme des signaux en provenance des cellules d’entrée, pondérés par des poids synaptiques. La formule est Aⱼ = ∑(Xᵢ . Wᵢⱼ).