ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites.


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-W0125 : Corpus TRAD de textes parallèles chinois-français – blog
    Il s’agit d’un corpus parallèle de
    15,809 caractères en chinois et une
    traduction de référence en français de
    11769 mots. Les textes sources
    proviennent de textes de blogs.

  • ELRA-L0100 : Dictionnaire de définitions français (SYNAPSE)
    Le dictionnaire de définitions français
    (SYNAPSE) contient 216 835 entrées (147
    378 noms, 80 552 adjectifs, 24 001
    verbes, 4 677 adverbes, 1 560 préfixes,
    107 prépositions, 614 interjections, 147
    pronoms, 42 conjonctions, 27 articles),
    309 078 définitions et 7 395 unités
    phraséologiques (syntagmes). Les
    informations grammaticales pour chaque
    entrée sont les suivantes: catégorie
    grammaticale, genre, nombre, formes
    fléchies. Ce dictionnaire est fourni au
    format XML accompagnée d’une DTD.

  • ELRA-W0124 : Corpus parallèle anglais-vietnamien
    Il s’agit d’un corpus anglais-vietnamien
    de 500.000 paires de phrases alignées.
    Ce corpus parallèle contient des
    documents en anglais traduits vers le
    vietnamien par des traducteurs
    professionnels. Les textes source
    contiennent des extraits de livre, de
    dictionnaires, de journaux et de
    l’information en ligne. Les textes sont
    fournis au format TEI.

  • ELRA-S0394 : Corpus de dialogue de négociation multi-thème Metalogue
    Ce corpus contient environ 2,5 heures de
    données de dialogue annotées au niveau
    sémantique en anglais et comprend les
    données de parole et les transcriptions.
    Six sujets uniques (étudiants entre 19
    et 25 ans) ont participé à la collecte.
    Les données audio de dialogue ont été
    captées via deux micro-casques et
    sauvegardées au format FLAC en 16kHz,
    16-bit mono linéaire PCM. Les
    transcriptions ont été produites de
    façon semi-automatique, en utilisant un
    système de reconnaissance de parole
    automatique, suivi par une correction
    manuelle. Tous les textes sont présentés
    en UTF-8 soit en texte plein soit en
    XML.

  • ELRA-S0395 : Corpus de caractérisation du locuteur Nautilus (NSC)
    Ce corpus comprend les enregistrements
    microphone propres de parole
    conversationnelle par 300 locuteurs
    allemands (126 hommes et 174 femmes)
    âgés de 18 à 35 ans, sans
    dialecte/accent marqué. Les
    enregistrements ont été réalisés dans
    une salle isolée au niveau acoustique en
    2016/2017. Quatre dialogues scénarisés
    et quatre autres semi-spontanés ont été
    réalisés par les locuteurs simulant des
    demandes d’information téléphoniques. En
    complément, des occurrences spontanées
    de parole neutre et émotionnelle ont été
    produites. Toutes les étiquettes sont
    fournies avec les enregistrements de
    parole et les métadonnées des locuteurs.

  • (dernière mise à jour : avril 2018)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0