Besoin

En fonction des matériaux dont vous disposez, Calliope satisfera certains de vos besoins :

Ce à quoi vous désirez aboutir Vos matériaux de départ Fonction de Calliope
Vous ne vous intéressez qu’à l’extraction de terminologie, afin de constituer des lexiques réutilisables, servant en particulier à indexer les articles de vos corpus, c’est-à-dire à représenter chaque article par une liste de termes (que vous avez validés) censés représenter l’article. Corpus textuels, indexés ou pas, fichiers tableur (LibreOffice, Excel), documents PDF (dans ce dernier cas, on ne récupère que le texte brut, sans notion de champ). Extraction de terminologie
Vous désirez agréger le contenu des corpus indexés en « clusters », visualiser ces clusters sous forme de cartes,
vous désirez mesurer l’évolution temporelle de vos corpus ou bien leurs différences de contenu.
Corpus textuels, normalisés XML, obligatoirement indexés (liste de mot-clefs). Méthode des mots associés + analyse des tendances

 

Les grandes fonctions de Calliope

  • Conversion XML : fonction utilitaire pour convertir les documents de texte balisé ou délimité, ou des PDF, en format standard XML, utilisé par toutes les autres fonctions Calliope.
  • Visualisation de corpus XML : fonction utilitaire pour afficher rapidement les documents XML, même les plus volumineux, mais aussi pour les convertir en fichier délimité ou autre XML comportant une partie des champs.
  • Terminologie : pour extraire la terminologie brute contenue dans les corpus XML normalisés, la qualifier (groupes de termes validés et synonymes), créer des lexiques réutilisables, et enfin pour indexer (annoter) les corpus XML avec le vocabulaire validé : chaque document du corpus est alors affecté d’une énumération de termes censés représenter son contenu; le corpus peut alors être traité par le module Calliope Process.
  • Mots associés et tendances : pour appliquer la méthode des mots associés aux corpus XML indexés (comportant des listes de termes représentatifs), et l’analyse des tendances dans le cas de plusieurs corpus.
  • Exploitation des résultats : pour visualiser les résultats produits par la méthode des mots associés et l’analyse de tendances : cartes interactives (diagramme stratégique des clusters, cartes des liens internes des clusters), classification et visualisation graphique des termes (émergents, stables, déclinants), retour vers les documents constitutifs des clusters.