ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0412
    Base de données audio d'enfants japonais (niveau cours moyen et collège)
    La base de données audio d'enfants japonais (niveau cours moyen et collège) contient les enregistrements de 232 enfants japonais (104 garçons et 128 filles), âgés de 9 à 13 ans (élèves de cours moyen et de première et deuxième année de collège), enregistrés dans des salles calmes en utilisant des smartphones. Cette base de données peut être complétée par la Base de données audio d'enfants japonais (niveau cours élémentaire) également disponible dans le catalogue ELRA sous la référence ELRA-S0411.

    Le nombre de locuteurs, les propos et la durée, l'âge sont les suivants:
    Nombre de locuteurs: 232 (104 hommes, 128 femmes)
    Nombre d'occurrences (moyennes): 385 occurrences par locuteur
    Nombre total d'occurrences: 89 454
    Age: de 9 à 13 ans
    Nombre total d'heures de données: 145,4

    1018 phrases ont été utilisées. Les enregistrements ont été réalisés via des smartphones et les données audio sont stockées dans des fichiers .wav sous forme de séquences de 16KHz mono, 16 bits, PCM linéaire.

    Base de données
    ・ Données audio: format WAV, 16 KHz, 16 bits, mono (enregistrées avec un smartphone)
    ・ Scripts d'enregistrement: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
    ・ Données de transcription: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
    ・ Taille: 16,2 Go

    Répartition par âge:
    9 ans: 56 (21 garçons, 35 filles)
    10 ans: 71 (30 garçons, 41 filles)
    11 ans: 65 (28 garçons, 37 filles)
    12 ans: 38 (24 garçons, 14 filles)
    13 ans: 2 (1 garçon, 1 fille)

    Structure de la base de données:
    ├─ readme.txt
    ├─ Japanese Kids Speech Database.pdf Document de description de la base de données
    ├─ Transcription.tsv Transcription
    ├─ scripts.tsv Script

    └─ voices/ répertoire de données audio
    └─ high/ répertoire des classes de niveau cours moyen et collège
    └─(speaker_ID/) répertoire des identifiants des locuteurs (six chiffres)
    └─(audio_file) fichiers audio (format WAV, 16KHz, 16bit, mono)

    Les conventions de nommage des fichiers audio sont les suivantes:
    Numéro du champ | Contenu | Description | Remarques
    0 | Identifiant de la langue | “JA” (fixed) | Japanese
    1 | Identifiant du locuteur | Six chiffres | 5XXXXX
    2 | Identifiant du script | HXXXX | XXXX: quatre chiffres
    3 | Age | Deux chiffres
    4 | Sexe | M: garçon, F: fille

    Le caractère de séparation est «_».
    Par exemple, si le nom du fichier audio est « JA_500002_H0001_10_F.wav » , ce fichier a la signification suivante:
    JA: ID de langue (japonais)
    500002: identifiant du locuteur
    H0001: identifiant du script
    10: âge (dix ans)
    F: sexe (femme)

    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Commercial 75000.00 EUR
    Academic - Research 12500.00 EUR
    Commercial - Commercial 75000.00 EUR
    Commercial - Research 50000.00 EUR
    Prix Non Membres
    Academic - Commercial 75000.00 EUR
    Academic - Research 12500.00 EUR
    Commercial - Commercial 75000.00 EUR
    Commercial - Research 50000.00 EUR
    145 - Table './catalog_elra/counter' is marked as crashed and should be repaired

    select startdate, counter from counter

    [TEP STOP]