ELRA ELRA
  Accueil Catalogue
Ressources Linguistiques
Rapports d'incidents
Envoyez-nous vos rapports d'incidents.
Consulter le catalogue
 
Utilisez des mots-clés pour trouver le produit que vous recherchez.
Recherche avancée
Langue(s)
Anglais Français
Informations
  • Procédure & Conditions d'achat

  • Prix et licences d'utilisation

  • Comment promouvoir vos ressources ?

  • Contactez-nous
  • Référence Catalogue : ELRA-W0128
    Corpus ECPC (European Comparable and Parallel Corpora of Parliamentary Speeches Archive) – ensemble 1
    Le Corpus ECPC (European Comparable and Parallel Corpora of Parliamentary Speeches Archive), compilé à l’Universitat Jaume I (Espagne), est une collection de corpus taggés au niveau métatextuel en XML et contenant des discours de trois chambres européennes (le Parlement européen, la Chambre des communes britannique et le Congrès des députés espagnol). C’est un corpus écrit bilingue, bidirectionnel en anglais et en espagnol, tel que décrit par Zanettin (2012). Ce premier ensemble (ECPC_EP-05) est composé des sessions journalières 2005 du Parlement européen avec (1) une version "nettoyée" en XML, (2) une version étiquetée en partie du discours, et (3) une version alignée au niveau des phrases. Dans son format brut, ECPC_EP-05 contient 3,668,476 tokens/mots (en excluant l’étiquetage) en anglais répartis sur plus de 60 fichiers en utf-8 et 3,993,867 tokens/words (en excluant l’étiquetage) en espagnol répartis sur plus de 60 fichiers en utf-8.

    ECPC_EP-05 par MARÍA CALZADA PÉREZ (en tant que coordinatrice du groupe de recherche ECPC à l'Universitat Jaume I, Espagne) est distribué sous une licence Creative Commons Attribution - Pas d’Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International (CC-BY-NC-SA 4.0: http://creativecommons.org/licenses/by-nc-sa/4.0). Tous les corpus de l'archive ECPC sont financés par: Universitat Jaume I (UJI-B2017-25 P1·1B2012-64), Generalitat Valenciana (AICO/2017/082), et le Ministerio de Educación, Cultura y Deporte (FFI2008-01610/FILO; HUM2005-03756/FILO).

    Informations techniques
    Support de distribution : Downloadable
    Format de fichiers : Plain text
    Contenus Cliquer sur la flèche afin d'afficher les informations des contenus.
    written corpus 
     
    Prix Membres
    * Disponible sous licence CC BY-NC-SA uniquement (http://creativecommons.org/licenses/by-nc-sa/4.0)
    Academic - Research Free
    Commercial - Research Free
    Prix Non Membres
    * Disponible sous licence CC BY-NC-SA uniquement (http://creativecommons.org/licenses/by-nc-sa/4.0)
    Academic - Research Free
    Commercial - Research Free

    Copyright © 2008 ELRA
    ELRACatalogue 0.8.0