ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0395
    Corpus de caractérisation du locuteur Nautilus (NSC)
    Le corpus de caractérisation du locuteur Nautilus (NSC) comprend les enregistrements microphone propres de parole conversationnelle par 300 locuteurs allemands (126 hommes et 174 femmes) âgés de 18 à 35 ans, sans dialecte/accent marqué. Les enregistrements ont été réalisés dans la salle isolée au niveau acoustique "Nautilus" (d’où découle le nom de cette base de données) du laboratoire Qualité et Utilisabilité de la Technische Universität Berlin, Allemagne, en 2016/2017.

    Quatre dialogues scénarisés et quatre autres semi-spontanés ont été réalisés par les locuteurs simulant des demandes d’information téléphoniques. En complément, des occurrences spontanées de parole neutre et émotionnelle (principalement excitation ou frustration) ont été produites. Les interactions entre les locuteurs et leur interlocuteur (un assistant d’enregistrement) sont fournies dans des fichiers mono séparés, accompagnés d’horodatage ("timestamp") et d’étiquettes définissant les tours de locuteur. Toutes les données audio sont échantillonnées à 48 kHz (fichiers audio/wav, 16-bit, 1 canal). Un microphone AKG C 414B-XLS a été utilisé pour enregistrer les locuteurs (95,6 heures de parole) et un micro-casque Sennheiser HMD 46 pour enregistrer l’interlocuteur (59,5 heures de parole).

    La parole correspondant à l’un des dialogues semi-spontanés a ensuite été évaluée au regard de 34 étiquettes numériques constantes de caractéristiques du locuteur interpersonnelles (telles que "likable", "attractive", "competent", "childish", etc.), pour les 300 locuteurs et par 15 auditeurs différents, en moyenne. Sur un sous-ensemble de 20 locuteurs sélectionnés comme "extrême", 34 descriptions naïves de voix (telles que brillante, grinçante, articulée, mélodieuse, etc.) ont également été évaluées par 26 évaluateurs externes.

    Toutes les étiquettes sont fournies avec les enregistrements de parole et les métadonnées des locuteurs (âge, genre, lieu de naissance, lieux chronologiques et durée de résidence, lieu de naissance de la mère et du père, personnalité auto-évaluée, etc.).

    Le matériel fourni dans le corpus NSC a pour vue de couvrir un intérêt large par les phonéticiens et scientifiques de la parole travaillant sur les corrélations perceptuelles et acoustiques des traits personnels. La production de parole et de prosodie et le comportement conversationnel dans les interactions humain-humain peuvent être étudiés en analysant les tours de parole spontanée entre locuteurs et interlocuteurs. Les données NSC peuvent également être convenir à d’autres travaux de recherche liés à la parole et nécessitant des enregistrements propres de haute qualité en allemand.

    ISLRN : 157-037-166-491-1
    Identification
    Période de couverture :
    Version : 1.0
    Historique des versions :
    Production
    Date de création : 2016-2017
    Informations techniques
    Support de distribution : Downloadable
    Format de fichiers : wav
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Research Free
    Prix Non Membres
    Academic - Research Free

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0