ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites.


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-W0126 : Données de test et d’entraînement pour la détection et la translittération de l’arabizi
    Ces données contiennent une collection
    de texte mélangés anglais et arabizi
    dans le but d’entraîner et de tester un
    système de détection automatique du
    changement de langue et un ensemble de
    3452 tokens en arabizi manuellement
    translittérés en arabe, dans le but
    d’entrainer et de tester un système de
    translittération de l’arabizi vers
    l’arabe.

  • ELRA-S0396 : Corpus oral mbochi
    Ce corpus comprend 5131 phrases
    enregistrées en mbochi avec leur
    transcription, et leur traduction en
    français, ainsi que le résultat du
    travail réalisé pendant le workshop
    JSALT: alignements au niveau phonétique,
    et divers résultats de segmentation en
    mots non supervisée à partir de l'audio.
    Le corpus audio contient 4,5 heures,
    échantillonnées à 16kHz, 16bits, avec
    codage Linear PCM. Les données sont
    séparées en 2 parties, une pour
    l'apprentissage (train) contenant 4617
    phrases, et une pour le développement
    (dev) contenant 514 phrases.

  • ELRA-S0397 : Base de données du chinois mandarin (du sud)
    Cette base de données contient les
    enregistrements de 1000 locuteurs du
    chinois mandarin de la Chine du Sud (500
    hommes et 500 femmes), âgés de 18 à 60
    ans, enregistrés dans des studios
    isolés. Les enregistrements ont été
    réalisés avec des microphones casques et
    consistent en 341 heures de données
    audio (environ 30 minutes par locuteur),
    stockées sur fichiers .WAV en séquences
    de 48 KHz Mono, 16 bits, Linear PCM.

  • ELRA-S0398 : Base de données du chinois mandarin (du nord)
    Cette base de données contient les
    enregistrements de 500 locuteurs du
    chinois mandarin de la Chine du Nord
    (250 hommes et 250 femmes), âgés de 18 à
    60 ans, enregistrés dans des studios
    isolés. Les enregistrements ont été
    réalisés avec des microphones casques et
    consistent en 172 heures de données
    audio (environ 30 minutes par locuteur),
    stockées sur fichiers .WAV en séquences
    de 48 KHz Mono, 16 bits, Linear PCM.

  • ELRA-W0125 : Corpus TRAD de textes parallèles chinois-français – blog
    Il s’agit d’un corpus parallèle de
    15,809 caractères en chinois et une
    traduction de référence en français de
    11769 mots. Les textes sources
    proviennent de textes de blogs.

  • (dernière mise à jour : août 2018)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0