Accéder directement au contenu Accéder directement à la navigation
Thèse

Fouille de motifs et modélisation statistique pour l'extraction de connaissances textuelles

Résumé : En traitement automatique des langues, deux grandes approches sont utilisées : l'apprentissage automatique et la fouille de données. Dans ce contexte, croiser les méthodes de fouille de données fondées sur les motifs et les méthodes d’apprentissage automatique statistique est une voie prometteuse mais à peine explorée. Dans cette thèse, nous présentons trois contributions majeures : l'introduction des motifs delta libres,utilisés comme descripteurs de modèle statistiques; l'introduction d'une contrainte de similarité sémantique pour la fouille, calculée grâce à un modèle statistique; l'introduction des règles séquentielles d'étiquetage,crées à partir des motifs et sélectionnées par un modèle statistique.
Mots-clés : Motifs descripteurs
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-02888696
Contributeur : Abes Star :  Contact
Soumis le : vendredi 3 juillet 2020 - 11:34:25
Dernière modification le : dimanche 5 juillet 2020 - 03:30:25

Fichier

edgalilee_th_2018_holat.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-02888696, version 1

Collections

Citation

Pierre Holat. Fouille de motifs et modélisation statistique pour l'extraction de connaissances textuelles. Modélisation et simulation. Université Sorbonne Paris Cité, 2018. Français. ⟨NNT : 2018USPCD045⟩. ⟨tel-02888696⟩

Métriques

Consultations de la notice

2