Materialien Romanistik
Hier finden Sie interessante Downloads rund um Ihr Studium in der Bonner Romanistik. Diese Rubrik wird stetig weiter ausgebaut.
Downloads
Onlinekorpora
Die folgende Auflistung hat das Ziel, den Zugriff auf linguistische Korpora des Französischen und Spanischen zu erleichtern. Sie unterscheidet hierbei erstens die zeitliche Einordnung der Korpora (Sprachgeschichte / Gegenwartssprache) sowie zweitens das Medium (geschriebene / gesprochene Sprache). Drittens sind ggf. die linguistischen Schwerpunkte der Korpora angegeben (Varietätenlinguistik / Sprachkontakt / Gesprächsanalyse / Lernerkorpora).
Digitale Korpora der gesprochenen Sprache umfassen in vielen Fällen nicht nur Transkriptionen, sondern auch Audio-Dateien (Sprachaufnahmen).
Wichtig: Es handelt sich um eine Auswahl online zugänglicher Korpora; die Liste erhebt keinen Anspruch auf Vollständigkeit. Bei Fragen wenden Sie sich bitte an Dr. Verena Weiland (vweiland@uni-bonn.de) bzw. an das Lehrstuhlteam von Prof.in Dr. Anke Grutschus.
„Ein Korpus ist eine Sammlung von Textdaten, also Sprache im Kontext, die dem Zweck der linguistischen Auswertung dient und eine quantitative Auswertung von (qualitativen) sprachlichen Merkmalen zulässt. Primärdaten bezeichnen die ursprünglich gesammelten Textdaten (ohne jegliche zusätzliche Information […]). Metadaten bezeichnen Informationen über diese Daten, z. B. den Autor, das Erstellungsjahr der Primärtexte, den Namen der Korpusersteller usw. Metadaten müssen sich nicht auf sämtliche Primärdaten im Korpus beziehen, sondern können einzelne Teile des Korpus umfassen. Annotationen bezeichnen Interpretationen der Primärdaten in Form linguistischer Kategorien (wie ›Nomen‹, ›Subjekt‹ oder ›Nebensatz‹)“ (Hirschmann 2019: 2).
Vollständige Referenz:
Hirschmann, Hagen (2019): Korpuslinguistik: Eine Einführung. Stuttgart: J.B. Metzler.
Französisch
Allgemein
- 4Base de Français Médiéval5
- Bibliothèque bleue de Troyes6 – Popular French print culture of 17th to mid-19th century France
- DocLing 7– Les plus anciens documents linguistiques de la France
- Français légal ancien de Normandie8
- Frantext4 – Corpus échantillonné du IXe au XXIe siècle
Varietätenlinguistik
- MCVF9 – Modéliser le changement: Les voies du français
Varietätenlinguistik
- 88milSMS10
- FrTenTen11 – French web corpus, Zugriff über Sketch Engine (ULB Bonn)12
- FDLQ 13– Fonds de données linguistiques du Québec
- CEFC 14– Orféo Corpus d'Étude pour le Français Contemporain
Sonstige
- DEDE 15– un corpus annoté pour le traitement des DEscriptions DEfinies
- French Treebank16 – Corpus arboré pour le français
Varietätenlinguistik
- ciel-f 17– Corpus International Écologique de la Langue Française
- CFPP2000 18– Corpus de Français Parlé Parisien des années 2000
- CFPB 19– Corpus de français parlé à Bruxelles
- CFPQ 20– Corpus de français parlé au Québec
- CFPR21 – Corpus du français parlé de nos régions
- ESLO 22– Enquêtes SocioLinguistiques à Orléans
- OFROM 23– Corpus oral de français de Suisse Romande
- PFC 24– Phonologie du Français Contemporain
- TCOF25 – Traitement des Corpus Oraux en Français
Sprachkontakt
- MPF26 – Multicultural Paris French
Gesprächsanalyse
- CLAPI27 – Corpus de Langues Parlées en Interaction
Lernerkorpora
Korpora mit didaktischem Schwerpunkt
- CLAPI-FLE30 – Corpus de Langues Parlées en Interaction-Français Langue Étrangère
Spanisch
Allgemein
- CDH 31– Corpus del Diccionario histórico de la lengua española
- CHEM 32– Corpus Histórico del Español en México
- CORDE 33– Corpus Diacrónico del Español
- CORDIAM 34– Corpus Diacrónico y Diatópico del Español de América35
- CORHEN 35– Corpus Histórico del Español Norteño
- Corpus del Español36 (Genre/Historical)32
- ODE 37– Oralia Diacrónica del Español
Varietätenlinguistik
- COREECOM 38– Corpus electrónico del Español colonial mexicano
Allgemein
- Corpus del Español39 (Web/Dialects)
- CEA 40– Corpus del Español Actual
- CORPES XXI41 – Corpus del Español del Siglo XXI
- Corpus de Referencia de la Lengua Española en Argentina42
- CREA 43– Corpus de Referencia del Español Actual
- esTenTen44 – Spanish web corpus, Zugriff über Sketch Engine12 (ULB Bonn)
Varietätenlinguistik
- CORPEEU45 – Corpus del Español en los Estados Unidos
Varietätenlinguistik
- COLA 46– Corpus Oral de Lenguaje Adolescente
- 47CORPEEU 45– Corpus del Español en los Estados Unidos
- COSCACH 48– Corpus Oral Sociolingüístico del Castellano de Chile
- COSER 49– Corpus Oral y Sonoro del Español Rural
- MEsA 50– Macrosintaxis del español actual
- PRESEEA 51– Proyecto para el estudio sociolingüístico del español de España y de América
Sprachkontakt
- COREC 52– Corpus Oral de Referencia de Español en Contacto
- Corpus.migra.sev53 – Corpus oral del español de los migrantes residentes en la ciudad de Sevilla
Lernerkorpora
- CHILDES54 – Child language Spanish corpora
Korpora mit didaktischem Schwerpunkt
- C-Or-DiAL55 – Corpus Oral Didáctico Anotado Lingüísticamente
- Auflistung von Lernerkorpora56 (L2, u.a. Französisch/Spanisch)
- Auflistung von Korpora des Spanischen in Mexiko57
- Portal de Corpus Históricos Iberorománicos58 – Auflistung historischer Korpora des Spanischen
- Textdaten Romanistik59 – Auflistung romanischsprachiger Korpora
- Tools zum Extrahieren von Daten aus Twitter/X60 zur Erstellung eigener Korpora
Links
- https://www.romanistik.uni-bonn.de/studium/medien-studium/richtlinien_rom_wissarbeiten_lw-bonn.pdf
- https://www.romanistik.uni-bonn.de/medien-romanistik/formatvorlage_rom_ling_april25.docx
- https://www.romanistik.uni-bonn.de/medien-romanistik/leitfaden_rom_ling_april25.pdf
- https://www.frantext.fr/
- http://bfm.ens-lyon.fr/
- https://artfl-project.uchicago.edu/node/170
- https://www.rose.uzh.ch/phoenix/workspace/web/corpus.php
- https://crisco.unicaen.fr/ressources-en-ligne/francais-de-normandie/
- https://github.com/beatrice57/mcvf-plus-ppchf
- http://88milsms.huma-num.fr/corpus.html
- https://www.sketchengine.eu/frtenten-french-corpus/
- https://auth.sketchengine.eu/#login
- https://fdlq.recherche.usherbrooke.ca/index.php/corpus
- https://www.projet-orfeo.fr/
- https://www.ortolang.fr/market/corpora/dede
- http://www.llf.cnrs.fr/en/Gens/Abeille/French-Treebank-fr.php
- http://www.ciel-f.org/
- http://cfpp2000.univ-paris3.fr/index.html
- http://cfpp2000.univ-paris3.fr/cfpb.html
- https://applis.flsh.usherbrooke.ca/cfpq/
- https://cfpr.huma-num.fr/
- http://eslo.huma-num.fr/
- https://ofrom.unine.ch/
- https://www.projet-pfc.net/
- https://cnrtl.fr/corpus/tcof/
- https://www.ortolang.fr/market/corpora/mpf
- http://clapi.ish-lyon.cnrs.fr/V3_Accueil_Corpus.php?interface_langue=FR
- https://childes.talkbank.org/access/French/
- https://web-archive.southampton.ac.uk/www.flloc.soton.ac.uk/
- http://clapi.ish-lyon.cnrs.fr/FLE/projet_clapi_fle.php
- https://www.rae.es/banco-de-datos/cdh
- http://www.corpus.unam.mx:8080/unificado/index.jsp?c=chem
- http://corpus.rae.es/cordenet.html
- https://cordiam.org/doc/presentacion.html
- https://corhen.es/
- https://www.corpusdelespanol.org/hist-gen/
- http://corpora.ugr.es/ode/index.php?action=cqp
- https://www.iifilologicas.unam.mx/coreecom/
- https://www.corpusdelespanol.org/web-dial/
- http://spanishfn.org/tools/cea/english
- http://web.frl.es/CORPES/view/inicioExterno.view
- http://www.lllf.uam.es/ESP/
- http://corpus.rae.es/creanet.html
- https://www.sketchengine.eu/estenten-spanish-corpus/
- https://corpus.corpeeu.org/consultas.php
- http://www.colam.org/om_prosj-espannol.html
- http://lablita.dit.unifi.it/corpora/cordial/
- http://sadowsky.cl/coscach-es.html
- http://www.corpusrural.es/descripcion.php
- https://grupo.us.es/grupoapl/materiales-corpus/corpus-mesa
- http://preseea.linguas.net/Inicio.aspx
- https://espanolcontacto.fe.uam.es/wordpress/index.php/corpus-oral-de-referencia/
- https://corpusmigrasev.snlt.es/lista-corpus/
- https://childes.talkbank.org/access/Spanish/
- http://lablita.it/app/cordial/corpus.php
- https://www.clarin.eu/resource-families/L2-corpora%20
- https://amla.org.mx/corpus-y-recursos-en-linea/
- http://www.corhiber.org/
- https://wikis.fu-berlin.de/display/tdr/Korpora+und+Textdatenbanken
- https://cran.r-project.org/web/packages/twitteR/index.html