ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Catalogue de Ressources Linguistiques

    ELRA met à disposition des Ressources Linguistiques gratuites.


    Le Catalogue de Ressources Linguistiques d’ELRA présente un répertoire des Ressources Linguistiques (RL) mises à disposition par ELRA.


    (voir l’image pleine page)

    Un nombre croissant de RL couvrant différents domaines des technologies de la langue (voir illustration à gauche) sont distribuées par ELDA, le corps opérationnel d’ELRA, grâce aux contributions de divers acteurs de la communauté des technologies de la langue.

    Notre objectif, à travers ce répertoire, est de mettre des ressources linguistiques à la disposition de la communauté pour éviter aux chercheurs et aux développeurs de perdre du temps à produire des ressources qui existent déjà, mais aussi pour les aider à identifier ces ressources et à y accéder.

    D’autres ressources identifiées, mais non disponibles via ELRA, sont présentées dans le Catalogue Universel.

    Pour toute suggestion ou commentaire, ou pour toute demande d’information sur ELRA et son Catalogue de Ressources Linguistiques, rendez-vous à la section Contactez-nous.

    ELRA est partenaire de OLAC (Open Language Archives Community). Le catalogue ELRA peut être visualisé sous la forme d’une archive OLAC.

    Nouvelles ressources
  • ELRA-S0402 : l'Atlas sonore des langues régionales de France
    L'Atlas sonore des langues régionales de
    France propose la même fable d'Ésope lue
    en français et en langues de France. Ce
    travail, qui possède une dimension
    scientifique et patrimoniale, consiste à
    mettre en valeur la diversité
    linguistique de la France hexagonale et
    des Outre-mer, à travers des
    enregistrements recueillis sur le
    terrain et présentés via une carte
    interactive, avec leur transcription
    orthographique. En ce qui concerne
    l'occitan, une soixantaine
    d'enregistrements a été collectée en
    Gascogne, Languedoc, Provence, dans le
    nord de l'Occitanie ainsi que dans la
    zone du Croissant. Des variétés de
    basque, breton, alsacien, francique,
    flamand occidental, corse, catalan,
    francoprovençal et langue(s) d'oïl sont
    également fournies, de même qu’une
    cinquantaine de langues dans les
    Outre-mer et des langues
    non-territoriales comme le rromani et la
    langue des signes française.

  • ELRA-S0399 : Ensemble de modèle multilingue GlobalPhone
    L’ensemble de modèle multilingue
    GlobalPhone contient environ 22 heures
    de parole lue transcrite, prononcée par
    des locuteurs natifs en 22 langues. Les
    données sont échantillonnées à partir
    des données orales et textuelles
    Globalphone disponibles dans le
    catalogue ELRA. Cet ensemble couvre
    environ 1 heure de parole transcrite
    pour 10 locuteurs (5 hommes, 5 femmes),
    de chacune des 22 langues mentionnées
    ci-dessus, soit une moyenne d’environ 6
    minutes ou 41 occurrences par locuteur
    pour un total de 220 locuteurs.

  • ELRA-S0400 : Ensemble de 2000 locuteurs GlobalPhone
    L’ensemble de 2000 locuteurs GlobalPhone
    contient de la parole lue transcrite
    pour 2000 locuteurs natifs en 22
    langues. Les données sont
    échantillonnées à partir des données
    orales et textuelles Globalphone
    disponibles dans le catalogue ELRA Cet
    ensemble couvre environ 9,000
    occurrences sélectionnées aléatoirement
    et lues par 2000 locuteurs natifs en 22
    langues, soit une moyenne de 4,5
    occurrences correspondant à 40 secondes
    de parole par locuteur pour un total 22
    heures de parole.

  • ELRA-S0401 : Dictionnaire audio persan
    Ce dictionnaire contient plus de 50000
    entrées (incluant presque toutes les
    formes de mots et tous les noms propres)
    avec les fichiers audio correspondants
    en MP3 et leur translitération en
    anglais. Les mots ont été enregistrés
    dans une pronunciation du persan
    standard (farsi) (par un même locuteur).
    Ce dictionnaire est fourni avec son
    logiciel.

  • ELRA-W0127 : Corpus NAFIS (Normalized Arabic Fragments for Inestimable Stemming)
    NAFIS (Normalized Arabic Fragments for
    Inestimable Stemming) est un corpus de
    référence pour la racinisation en arabe
    constitué d’une collection de 37
    phrases, sélectionnées comme étant
    représentatives des tâches de
    racinisation en arabe et manuellement
    annotées. Les phrases compilées
    proviennent de sources variées (poèmes,
    le Coran, livres et journaux) et de
    différents types (proverbes et dictons,
    commentaires d’articles, textes
    religieux, littérature, fictions
    historiques). NAFIS est représenté sous
    le standard TEI.

  • (dernière mise à jour : décembre 2018)

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0