ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites.


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-S0411 : Base de données audio d'enfants japonais (niveau cours élémentaire)
    La base de données audio d'enfants
    japonais (niveau cours élémentaire)
    contient les enregistrements de 179
    locuteurs d'enfants japonais (71 garçons
    et 108 filles), âgés de 6 à 9 ans
    (élèves de première, deuxième et
    troisième année à l'école élémentaire),
    enregistrés dans des salles calmes en
    utilisant des smartphones. 1019 phrases
    ont été utilisées. Les enregistrements
    ont été réalisés via des smartphones et
    les données audio sont stockées dans des
    fichiers .wav sous forme de séquences de
    16KHz mono, 16 bits, PCM linéaire.

  • ELRA-S0412 : Base de données audio d'enfants japonais (niveau cours moyen et collège)
    La base de données audio d'enfants
    japonais (niveau cours moyen et collège)
    contient les enregistrements de 232
    enfants japonais (104 garçons et 128
    filles), âgés de 9 à 13 ans (élèves de
    cours moyen et de première et deuxième
    année de collège), enregistrés dans des
    salles calmes en utilisant des
    smartphones. 1018 phrases ont été
    utilisées. Les enregistrements ont été
    réalisés via des smartphones et les
    données audio sont stockées dans des
    fichiers .wav sous forme de séquences de
    16KHz mono, 16 bits, PCM linéaire.

  • ELRA-S0410 : Corpus CAREGIVER
    Ce corpus de parole multilingue utilisé
    pour la modélisation d’acquisition de la
    langue appelé CAREGIVER a été conçu et
    enregistré dans le cadre du projet
    ACORNS (Acquisition of Communication and
    Recognition Skills – Acquisition de
    compétences de communication et de
    reconnaissance) financé par l’Union
    européenne. Le corpus actuel contient
    environ 66 000 fichiers audio basés sur
    l’occurrence sur une période de 2 ans
    pour 16 locuteurs hommes et 14 locuteurs
    femmes natifs du néerlandais, anglais et
    finnois. Une transcription
    orthographique est disponible pour
    chaque occurrence. Des annotations
    consistant en l’alignement temporel au
    niveau du mot et des phones existent
    pour certains des sous-corpus.

  • ELRA-S0409-01 : Corpus de conversations pour la reconnaissance du chinois mandarin MDT – Version complète
    Ce jeu de données consiste en 4,98
    heures de parole conversationnelle
    transcrite en chinois mandarin, avec 30
    conversations enregistrées par 32
    locuteurs (16 hommes et 16 femmes). Les
    fichiers audio sont échantillonnés en 16
    kHz et quantifiés en 16 bits.

  • ELRA-S0409-02 : Corpus de conversations pour la reconnaissance du chinois mandarin MDT – 1 canal
    Ce jeu de données consiste en 4,98
    heures de parole conversationnelle
    transcrite en chinois mandarin, avec 30
    conversations enregistrées par 32
    locuteurs (16 hommes et 16 femmes). Les
    fichiers audio sont échantillonnés en 16
    kHz et quantifiés en 16 bits.

  • (dernière mise à jour : septembre 2021)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0