Abstract de la publi numéro 7460

Nous présenterons une approche statistique pour la recherche de termes équivalents en vue d’être appliquée pour le filtrage d’information. Cette approche est basée sur une étude statistique des NGrams partagés entre deux termes et est inspirée de la mesure communément utilisée en recherche d’information. Du fait de son caractère statistique, l’approche est totalement indépendante des caractéristiques lexicales et grammaticales de la langue. Des expérimentations ont été menées sur des documents écrits en langue française et d’autres écrits en langue anglaise et les résultats obtenus sont assez encourageants.