ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0411
    Base de données audio d'enfants japonais (niveau cours élémentaire)
    La base de données données audio d'enfants japonais (niveau cours élémentaire) contient les enregistrements de 179 locuteurs enfants japonais (71 garçons et 108 filles), âgés de 6 à 9 ans (élèves de première, deuxième et troisième année à l'école élémentaire), enregistrés dans des salles calmes en utilisant des smartphones. Cette base de données peut être complétée par la Base de données audio d'enfants japonais (niveau cours moyen et collège) également disponible dans le catalogue ELRA sous la référence ELRA-S0412.

    Le nombre de locuteurs, d’occurrences, la durée et l'âge sont les suivants:
    Nombre de locuteurs: 179 (71 hommes, 108 femmes)
    Nombre d'occurrences (moyennes): 325 occurrences par locuteur
    Nombre total d'occurrences: 58 214
    Age: de 6 à 9 ans
    Nombre total d'heures de données: 116,6

    1019 phrases ont été utilisées. Les enregistrements ont été réalisés via des smartphones et les données audio sont stockées dans des fichiers .wav sous forme de séquences de 16KHz mono, 16 bits, PCM linéaire.

    Base de données;
    ・ Données audio: format WAV, 16 KHz, 16 bits, mono (enregistrées avec un smartphone)
    ・ Scripts d'enregistrement: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
    ・ Données de transcription: format TSV (délimité par des tabulations), UTF-8 (sans BOM)
    ・ Taille: 12,9 Go

    Répartition par âge:
    6 ans: 35 (17 garçons, 18 filles)
    7 ans: 58 (26 garçons, 32 filles)
    8 ans: 67 (22 garçons, 45 filles)
    9 ans: 19 (6 garçons, 13 filles)

    Structure de la base de données:
    ├─ readme.txt
    ├─ Japanese Kids Speech Database.pdf Document de description de la base de données
    ├─ Transcription.tsv Transcription
    ├─ scripts.tsv Scripts

    └─ voices/ répertoire des données audio
    └─ low/ répertoire des petites classes
    └─(speaker_ID/) répertoire des identifiants des locuteurs (six chiffres)
    └─(audio_file) fichiers audio (format WAV, 16KHz, 16bit, mono)

    Les conventions de nommage des fichiers audio sont les suivantes:
    Numéro du champ | Contenu | Description | Remarques
    0 | Identifiant de la langue | “JA” (fixed) | Japanese
    1 | Identifiant du locuteur | Six chiffres | 4XXXXX
    2 | Identifiant du script | LXXXX | XXXX: quatre chiffres
    3 | Age | Deux chiffres
    4 | Sexe | M: garçon, F: fille

    Le caractère de séparation est «_».
    Par exemple, si le nom du fichier audio est «JA_400001_L0001_07_F.wav, ce fichier a la signification suivante:
    JA: ID de langue (japonais)
    400001: identifiant du locuteur
    L0001: identifiant du script
    07: âge (sept ans)
    F: sexe (femme)

    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Commercial 60000.00 EUR
    Academic - Research 10000.00 EUR
    Commercial - Commercial 60000.00 EUR
    Commercial - Research 40000.00 EUR
    Prix Non Membres
    Academic - Commercial 60000.00 EUR
    Academic - Research 10000.00 EUR
    Commercial - Commercial 60000.00 EUR
    Commercial - Research 40000.00 EUR
    145 - Table './catalog_elra/counter' is marked as crashed and should be repaired

    select startdate, counter from counter

    [TEP STOP]