LABS

 Syllabs a beaucoup investi en R&D et nos équipes d’experts ont développé des technologies uniques issues des besoins clients.

Nos produits sont très rapides et facilement adaptables à des besoins spécifiques ou de nouvelles langues. La participation à de nombreux projets de recherche nous a permis d’être à la pointe de la technologie d’analyse des données du web et de proposer des solutions originales et innovantes répondant à des problèmes concrets.

Depuis sa création en 2006, Syllabs a contribué à de nombreux projets de recherche et publié de nombreux articles scientifiques

Projets en cours

Vesta Cosy
Vers un Espace Tactile d’Argumentation, Collaboratif et Symbolique
2012 - 2015
› Description
Le projet Vesta Cosy a pour but de développer un tableau de bord permettant de modéliser une situation (situation géopolitique d’un pays, situation d’un marché économique, etc.) et d’alimenter le modèle avec des informations provenant du web. Ou des réseaux sociaux.
› Financeur
DGA
› Partenaires
ENSCI, Intactile DESIGN (leader), Syllabs
Tourinflux
2013 - 2016
› Description
L’objectif de Tourinflux est de proposer aux institutionnels du tourisme un tableau de bord permettant de visualiser et interpréter l’information disponible pour un territoire donné et de les aider ainsi à mieux comprendre comment il est perçu.
› Financeur
Investissements d'Avenir (appel à projets Cloud Computing - Big Data)
› Partenaires
Aproged, Proxem, L3I, Syllabs
REQUEST
REcursive QUEry and Scalable Technologies
2014 - 2017
› Description
REQUEST a pour objectif d'implémenter une architecture ouverte dédiée à la gestion, l'analyse et au traitement de données massives, et à leur visualisation analytique et interactive dans un contexte de cybercriminalité, cybersécurité et transports intelligents.
› Financeur
Investissements d'Avenir (appel à projets Cloud Computing - Big Data)
› Partenaires
ALDECIS, ALTIC, INRIA Bordeaux, ISTHMA, L2TI Paris 13, LIP6, LIMSI, Orange, SNCF, Syllabs, Talend, Thales (leader) Université Lyon, UTT
Gafes
GAleries des FEStivals
2014-2018
› Description
Le projet GAFES explore des pistes pour une exploitation du potentiel de l'internet sur deux axes : l'étude des usages et des usagers des festivals et la ré-éditorialisation de leurs contenus. Ces deux axes reposent sur une base technologique commune : la collecte de données relatives à des festivals et de leurs valorisations.
› Financeur
ANR
› Partenaires
Eurecom, GECE, LIA (leader), Syllabs

Projets terminés

Feed-ID
2009 - 2011
› Description
L’objectif du projet Feed-ID est de proposer un portail européen de référencement des sources d'information, au fonctionnement ouvert, garantissant la qualité des sources indexées proposant à la fois une façade publique pour les internautes et une collection d’APIs lui permettant de s’intégrer pleinement à l’écosystème atomisé et interopérable du web2.0.
› Financeur
DGCIS
› Partenaires
RTGI, Syllabs (leader), Wikio
Blogoscopie
2006 - 2008
› Description
Le but de ce projet est de développer des outils d’analyse des blogs permettant d’effectuer, automatiquement, les deux tâches suivantes : l’étude d’image et l’étude de tendance. L’analyse d’image obtenue sera comparée avec des analyses produite avec d’autres moyens.
› Financeur
ANR
› Partenaires
LINA - Université de Nantes (leader), OverBlog, Sinequa, Syllabs
Piithie
Plagiat et Impact de l'Information Textuelle recHerchée dans un contexte InterlinguE
2007-2009
› Description
Le projet Piithie s´inscrit dans un mouvement de la maîtrise de l´information diffusée. Son premier objectif est la détection de plagiats de textes. Les techniques de traitement automatique des langues (TAL), permettent d'améliorer les performances de recherche d’outils de détection de contenu dupliqué. Le deuxième objectif concerne le suivi d´impact : les diffuseurs d'information sont très intéressés par la possibilité d´évaluer l´impact de leur production.
› Financeur
ANR
› Partenaires
Advestigo, LIA - Université d'Avignon, LINA, Sinequa (leader), Syllabs
RPM2
Résumé Plurimedia, Multi-documents et Multi-opinions
2011
› Description
Le projet RPM2 explore la problématique du résumé dans le but de fournir une information condensée et efficace. Le but est la mise au point de méthodes de résumé multi-documents en prenant en compte les aspects web 2.0, gestion de l’information multimédia/plurimédia, génération de nouveaux documents à partir d’un flux existant, collection de contenus avec une cohérence éditoriale et approche multimodale de l’indexation.
› Financeur
ANR
› Partenaires
Institut Eurecom, LIA - Université d'Avignon, Sinequa (leader), Syllabs, Wikio
Edylex
Enrichissement dynamique de Ressources Lexicales multilingues en contexte multimodal
2009 - 2012
› Description
L’objectif du projet EDyLex est de comprendre l'acquisition dynamique de nouvelles entrées dans des lexiques existants utilisés au sein de chaînes d'analyse syntaxique et sémantique complètes. Le contexte applicatif du projet est celui des dépêches de l’Agence France-Presse (AFP).
› Financeur
ANR
› Partenaires
AFP (leader), LIF, LIMSI, Syllabs, Vecsys Research
OTMedia
Observatoire TransMédia
2010-2013
› Description
L’OTMedia a pour objectif la traçabilité des évènements médiatiques sur tous les supports de diffusion : web, presse, radio et télévision. Il s’agit de mettre en place une plateforme d’analyse des différents flux médiatiques pour détecter, suivre, mesurer, analyser et étudier la propagation des évènements médiatiques etc.
› Financeur
ANR
› Partenaires
AFP, CIM, INA (leader), INRIA, LIA - Université d'Avignon, Syllabs
METRICC
MÉmoire de Traduction, Recherche Interlingue et Corpus Comparables
2008
› Description
Le projet MéTRICC propose d’exploiter les possibilités offertes par des corpus comparables dans le cadre de trois applications industrielles : les mémoires de traduction, la recherche d’informations interlingue et la catégorisation multilingue. Il vise à répondre à plusieurs défis : l’extraction de ressources bilingues et leur exploitation dans les applications identifiées.
› Financeur
ANR
› Partenaires
LIG, LINA - Université de Nantes (leader), Lingua et Machina, LoCoRN, Sinequa, Syllabs, Valoria
TTC
Terminology Extraction, Translation Tools and Comparable Corpora
2010 - 2012
› Description
Le projet TTC vise la constitution de ressources terminologiques bilingues à partir de corpus comparables récupérés sur le web, et leur utilisation par la suite par des outils de traduction automatique.
› Financeur
Commission Européenne (FP7)
› Partenaires
IMS Stuttgart, LINA - Université de Nantes (leader), Syllabs, Tilde, University of Leeds
SuMACC
Apprentissage coopératif semi-SUpervisé de concepts Multimédias pour l'Aide à la Catégorisation et la détection de Concepts
2011
› Description
SuMACC a pour but d'explorer des stratégies d'apprentissage originales pour l'identification d'entités multimédias à partir de patrons d'identification. L'utilisation des patrons offre un cadre unifié dans lequel différentes règles de combinaison peuvent être formulées.
› Financeur
ANR
› Partenaires
Eurecom, LIA - Université d'Avignon (leader), Syllabs, Wikio

Publications

2014
Clément de Groc & Xavier Tannier
Apprendre à ordonner la frontière de crawl pour le crawling orienté
CORIA, Nancy (France)
Clément de Groc & Xavier Tannier
Apprendre à ordonner la frontière de crawl pour le crawling orienté
CORIA, Nancy (France)
Clément de Groc & Xavier Tannier
Apprendre à ordonner la frontière de crawl pour le crawling orienté
CORIA, Nancy (France)
Clément de Groc, Xavier Tannier & Claude de Loupy
Thematic Cohesion: Measuring Terms Discriminatory Power Toward Themes
LREC, Reykjavik (Islande)
Clément de Groc & Xavier Tannier
Evaluating Web-as-corpus Topical Document Retrieval with an Index of the OpenDirectory
LREC, Reykjavik (Islande)
Mohamed Morchid, Richard Dufour, Francis Bouvier, Clément de Groc, Claude de Loupy, Georges Linarès, Bernard Merialdo, Usman Niaz & Bertrand Peralta
SuMACC: a French Corpus for Multimedia Concept Retrieval
TSD, Brno (République Tchèque)
2013
Helena Blancafort, Francis Bouvier, Béatrice Daille, Ulrich Heid & Anita Ramm
TTC Web Platform: from Corpus Compilation to Bilingual Terminologies for MT and CAT Tools
TRALOGY II, Paris (France)
Béatrice Daille & Helena Blancafort
Knowledge-poor and knowledge-rich Approaches for Multilingual Terminology Extraction
CICLING, Samos (Greece)
Frederik Cailliau, Ariane Cavet, Clément de Groc & Claude de Loupy
Lexiques de corpus comparables et recherche d’information multilingue
TALN, Sables d'Olonne (France)
Rémi Ferrez, Clément de Groc & Javier Couto
Mining Product Features from the Web: a Self-Supervised Approach
Lecture Notes in Business Information Processing
Clément de Groc
Collecte orientée sur le Web pour la recherche d’information spécialisée
Thèse de doctorat, Université Paris-Sud, Orsay (France)
2012
Tatiana Gornostay, Anita Gojun, Marion Weller, Ulrich Heid, Emmanuel Morin, Béatrice Daille, Helena Blancafort, Serge Sharoff & Claude Méchoulam
Terminology Extraction, Translation Tools and Comparable Corpora: TTC Concept, midterm progress and achieved results
CREDISLAS, Istanbul (Turquie)
Elizaveta Loginova, Anita Gojun, Helena Blancafort, Marie Guégan, Tatiana Gornostay & Ulrich Heid
Reference Lists for the Evaluation of Term Extraction Tools
TKE, Madrid (Espagne)
Clément de Groc & Xavier Tannier
Experiments on Pseudo Relevance Feedback using Graph Random Walks
SPIRE, Cartagena de Indias (Colombie)
Clément de Groc, Xavier Tannier & Claude de Loupy
Un critère de cohésion thématique fondée sur un graphe de cooccurrences.
TALN, Grenoble (France)
Rémi Ferrez, Clément de Groc & Javier Couto
Self-supervised Product Feature Extraction using a Knowledge Base and Visual Clues
WEBIST, Porto (Portugal)
Araceli Alonso, Helena Blancafort, Clément de Groc, Chrystel Millon & Geoffrey Williams
METRICC: Harnessing Comparable Corpora for Multilingual Lexicon Development
Euralex, Oslo (Norway)
2011
Fabien Poulard, Béatrice Daille, Christine Jacquin, Laura Monceaux & Helena Blancafort
Comparability Measurement for Terminology Extraction
CHAT, Riga (Lettonie)
Marion Weller, Helena Blancafort, Anita Gojun & Ulrich Heid
Terminology extraction and term variation patterns: a study of French and German data
GSCL, Universität Hamburg (Allemagne)
Marie Guégan & Claude de Loupy
Knowledge-Poor Approach to Shallow Parsing: Contribution of Unsupervised Part-of-Speech Induction.
RANLP, Hissar (Bulgarie)

Ils nous soutiennent

logo-scientipole
logo-paris-co
logo-numa
logo-investtissements_avenir
logo-finance_innovation
logo-dge
logo-dga
logo-cap_digital
logo-bpifrance
logo-anr

Actualités, coulisses…

Suivez nous sur les réseaux sociaux

sur Twitter
sur Linkedin