ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-S0394
    Corpus de dialogue de négociation multi-thème Metalogue
    INTRODUCTION

    Le corpus de dialogue de négociation multi-thème Metalogue a été développé par le consortium Metalogue (http://cordis.europa.eu/project/rcn/110655_en.html) dans le cadre du septième Programme-Cadre pour la recherche et le développement technologique de la Communauté européenne (https://ec.europa.eu/research/fp7/index_en.cfm). Cette publication contient environ 2,5 heures de données de dialogue annotées au niveau sémantique en anglais et comprend les données de parole et les transcriptions.

    L’objectif du project Metalogue est de développer un système de dialogue avec une gestion flexible des dialogues afin de permettre au comportement du système de définir des buts, choisir des stratégies et contrôler les divers processus. Les participants ont pris part dans un scénario de négociation multi-thème au cours duquel un représentant du conseil municipal et un représentant d’une PME négocient la mise en œuvre d’un nouveau règlement anti-tabac. La négociation prend en compte quatre thèmes, chacun comprenant quatre ou cinq options. Les participants reçoivent un profil de préférence pour chaque scénario et négocient dans le but d’obtenir un accord avec la valeur la plus haute basée sur leur préférence. Les négociateurs ne sont pas autorisés à accepter un accord avec une valeur négative, ni de partager leurs profils de préférence avec d’autres participants.

    DONNEES

    Six sujets uniques (étudiants entre 19 et 25 ans) ont participé à la collecte. Les données audio de dialogue ont été captées via deux micro-casques et sauvegardées au format FLAC en 16kHz, 16-bit mono linéaire PCM. Les fichiers de signaux de parole sont de deux types: une session de dialogue complète et le signal de parole segmenté, coupé par locuteur et par tour de parole (approximativement).

    Les transcriptions ont été produites de façon semi-automatique, en utilisant un système de reconnaissance de parole automatique, suivi par une correction manuelle.

    Sept types d’annotation ont été réalisées manuellement en utilisant l’outil Anvil (http://www.anvil-software.org): annotations d’actes de dialogue; actes de structure de discours; actes de gestion de contact; actes de dialogue de gestion de tâche; tours de négociation; relations rhétoriques; et les "disfluences" dans la production de parole. Plus d’informations sur le procédé d’annotation sont incluses dans la documentation.

    Tous les textes sont présentés en UTF-8 soit en texte plein soit en XML.

    ISLRN : 217-906-813-531-9
    Identification
    Période de couverture :
    Version : 1.0
    Historique des versions :
    Production
    Projet : Metalogue
    Informations techniques
    Support de distribution : Downloadable
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
     speech corpus 
     
    Prix Membres
    Academic - Commercial Free
    Academic - Research Free
    Commercial - Commercial Free
    Commercial - Research Free
    Prix Non Membres
    Academic - Commercial 250.00 EUR
    Academic - Research 250.00 EUR
    Commercial - Commercial 250.00 EUR
    Commercial - Research 250.00 EUR

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0