|
|||||||
![]() |
Projets de recherche, campagnes d'évaluation et encadrement |
||||||
| SYLLABS | |||||||
La création de Syllabs en 2006 a pour but la mise à disposition d'un potentiel indépendant de développement innovant et de Recherche pour les PME (qui ont du mal à maintenir une Recherche de bon niveau en raison des contraintes économiques) et même pour les Grands Groupes qui ont souvent besoin de sous-traiter des tâches de Recherche particulières. En deux années, Syllabs a développé un très fort résseau de partenaires et de clients dans les domaines du traitement des langues et de la gestion d'information (voir la page partenaires sur le site de Syllabs). 7 personnes travaillent actuellement à Syllabs dont 2 docteurs-ingénieurs et 4 Bac+5. Nous participons actuellement à 5 projets de recherche multipartenaires. |
|||||||
| Création et direction d'un laboratoire de Recherche | |||||||
2000-2005 |
La création de Syllabs n'est pas venue de rien. Auparavant, j'ai été chargé de la création et de la direction de Sinequa Labs afin de doter Sinequa d'une entité de Recherche permettant le développement de nouvelles technologies et chargée de faire le lien avec les laboratoires publics. De nombreuses fonctionnalités du moteur de recherche Intuition de Sinequa proviennent de la Recherche effectuée à Sinequa Labs. L'équipe a compté jusqu'à 5 permanents dont deux linguistes et trois informaticiens, tous ayant des compétences en TAL. Une thèse a été soutenu pendant cette période (Eric Crestan) et deux thèeses sont encore en cours (Eric Blaudez et Frederik Cailliau). De nombreux laboratoires ont collaboré de manière étroite avec nous : INRIA, LADL, LIA, LIMSI, LIP6, LLI, LPE, SILEX, TALANA, VALORIA. |
||||||
| PROJETS co-financés | |||||||
2006- |
Projets en cours à Syllabs : RPM2 (2008-), Piithie (2007-), Blogoscopie (2007-), TextCoop (2006-). À ces projets s'ajoute le projet PIC financé par le TGE ADONIS. |
||||||
2003-2005 |
CARMEL : L’objectif du projet est la création d'un corpus de référence, libre de droit, multilingue (français, espagnol, italien et anglais), aligné, comportant des étiquettes thématiques et une désambiguïsation sémantique sur certains mots. les outils de désambiguïsation, d'alignement et les interfaces permettant l'annotation du corpus seront fournies à la fin du projet. Il s'agit d'un projet RIAM. Partenaires : Laboratoire Informatique d'Avignon (chef de projet), Sinequa Labs, LIDILEM, ACCE. |
||||||
2002-2005 |
AudioSurf : L’objectif du projet est la production d'un système intégrant le traitement de documents audio et des facilités de gestion de l’information telles qu’il en existe pour le texte (recherche documentaire, extraction d’informations, classification, routage, filtrage, etc.). Il s'agit d'un projet RNTL. Partenaires : Sinequa Labs (chef de projet), Vecsys et le LIMSI. |
||||||
2002-2005 |
OuRAL : L’objectif du projet est la production d'outils et de ressources de base pour le traitement automatique des langues. Il s'agit d'un projet Technolangue. Partenaires : Sinequa Labs (chef de projet), laboratoires LPE, LIA, LIP6, SILEX, VALORIA. |
||||||
2002-2005 |
RNIL : Il s'agit du volet français de l'ISO TC37-SC4 dont le but est de définir une norme de codage des informations linguistiques. Il s'agit d'un projet Technolangue. Partenaires : de très nombreux partenaires dont l'AFNOR (chef de projet). |
||||||
2002-2004 |
EQueR : Ce projet a pour but la création d'un environnement d'évaluation des systèmes de question/réponse en français. Une évaluation sera faite en juillet 2004. Il s'agit d'un projet Technolangue. Partenaires : de très nombreux partenaires dont ELRA (chef de projet). |
||||||
1999-2001 |
RDIL : Recherche en Sémantique Multilingue pour l'Indexation de Documents et pour la Traduction Automatique. Le but était la création d'un moteur de recherche interlingue utilisant la traductino automatique de Systran et le moteur de recherche Intuition de Sinequa. Partenaires : Sinequa (chef de projet), Systran, LIPN, ELDA. |
||||||
1998-1999 |
EuroWordNet : Projet européen de construction de réseaux sémantiques multilingues de type WordNet permettant des correspondances sémantiques entre les langues. Partenaires : nombreux partenaires dont University of Amsterdam (chef de projet). |
||||||
1995-1997 |
MulText : projet européen de développement d'outils et de ressources multilingues pour le traitement automatique des langues. 18 langues impliquées en Europe de l'Ouest ou Centrale (MulText-East) et en Afrique. Partenaires : nombreux partenaires dont le LPL (chef de projet). |
||||||
| CAMPAGNES D'ÉVALUATION | |||||||
2004 |
EQueR : en cours, participation à l'élaboration d'un environnement d'évaluation pour les systèmes de question/réponse en français. Participation à l'évaluation elle-même (bons résultats : 2ème pour les réponses longues). |
||||||
2002 |
TREC-11 : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des systèmes de Question-Réponse de TREC. |
||||||
2001 |
Senseval-2 : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des systèmes désambiguïsation sémantique en anglais (bons résultats : 3ème place). |
||||||
1999 |
Amaryllis-2 : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des moteurs de recherche en français. |
||||||
1998 |
TREC-7 : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des moteurs de recherche en anglais (résultats honorables pour une première participation -- moyen). |
||||||
1998 |
Senseval-1 : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des systèmes de désambiguïsation sémantique en anglais (bons résultats : 4ème place). |
||||||
1998 |
Romanseval : participation avec le Laboratoire Informatique d'Avignon à l'évaluation des systèmes de désambiguïsation sémantique en français (excellents résultats mais difficiles à comparer aux autres car la méthode était semi-automatique -- 1ère place). |
||||||
1997-1998 |
GRACE : participation avec le LPL et le Laboratoire Informatique d'Avignon à l'évaluation des systèmes d'étiquetage grammatical du français. |
||||||
| ENCADREMENT DE RECHERCHE | |||||||
2008- |
Thèse de Thierry Waszak : Sujet: Création automatique de lexiques en vue de la catégorisation de textes. Il s'agit d'une convention CIFRE avec le Laboratoire Informatique d'Avignon (patrice Bellot & Marc El-Bèze). |
||||||
2007 |
Master Recherche de Michaël Bagur : Sujet: Syltag : Analyseur Morphosyntaxique Multi-niveaux. En collaboration avec le LINSI (Anne Vilnat) |
||||||
2005- |
Thèse de Frederik Cailliau : Sujet: Conception et mise en oeuvre d'un système de gestion de ressources linguistiques. Il s'agit d'une convention CIFRE avec le Laboratoire Informatique de Paris Nord (Adeline Nazarenko). |
||||||
2001-2005 |
Thèse d'Eric Crestan : Sujet: Prise en compte des niveaux sémantiques et pragmatiques dans une perspective de recherche d'information automatisée sur des bases de données textuelles. Il s'agit d'une convention CIFRE avec le Laboratoire Informatique d'Avignon (Marc El-Bèze). Soutenue le 15/12/2005. |
||||||
2004- |
Thèse d'Eric Blaudez : Sujet: Fusion d'informations pour l'analyse linguistique et la gestion documentaire. Il s'agit d'une convention CIFRE avec le Laboratoire Informatique d'Avignon (Marc El-Bèze & Patrice Bellot). |
||||||
2004 |
DEA de Frederik Cailliau : Sujet: Modélisation d’objets linguistiques pour une meilleure gestion des ressources linguistiques. En collaboration avec le LIPN (Adeline Nazarenko). |
||||||
2002 |
DEA d'Izoumi Juliette L'Hériteau : Sujet: Analyse des questions et recherche sur Internet pour un système de question/réponse. En collaboration avec le LIPN (Adeline Nazarenko). |
||||||