Korpora

Die Korpora im Überblick

Der Korpusbereich bei mediensprache.net umfasst mehrere Korpora, die im Folgenden aufgelistet sind. Bitte beachten: Um auf die Korpora zugreifen zu können, müssen Sie sich anmelden.

Alpenpanorama D/A/CH/I

Kurzbeschreibung: Im Alpenpanorama auf 3sat präsentieren sich Alpenferienorte und -regionen mit Echtzeitbildern (Kamera), Wetterinformationen sowie mit max. zweizeiligen Werbetexten (Ortsinformationen, Veranstaltungen, Aktionen)
Repräsentativ für das ganzjährige Alpenpanorama; die Datenerhebung erfolgte (wg. geringer, vor allem saisonalen Änderungen) alle zwei Monate jeweils am 29. (29.11.2002, 29.01./03./05./07./09.2003).
Erhebungszeitraum: 29.11.2002-29.09.2003
Durchsuchbare Belege: 681
Erhebung: © Torsten Siever

Bons (Artikelbezeichnungen)

Kurzbeschreibung: Das Korpus beinhaltet Artikelbezeichnungen auf Belegen/Bons, die aufgrund der Raumbeschränkung zumeist gekürzt werden müssen.
Nicht repräsentativ aufgrund fehlender Randomisierung und Auswahl von Einträgen (keine ungekürzten).
Erhebungszeitraum: 01.01.2002-31.12.2005
Durchsuchbare Belege: 271
Erhebung: © Torsten Siever

Chatbot (Max)

Kurzbeschreibung: Chatprotokoll des Chatbots namens Max am Heinz-Nixdorf-MuseumsForum, Paderborn. Suchergebnisse und Wortindizes können auf Turns von System/User beschränkt werden.
Vollkorpus
Erhebungszeitraum: 01.01.2003-01.08.2006
Durchsuchbare Belege: 79906
Erhebung: © Ipke Wachsmuth

Fahrgastfernsehen der X-CITY MEDIEN, Hannover

Kurzbeschreibung: Das Fahrgastfernsehen der X-CITY MEDIEN ist in hannoverschen Stadtbahnen und U-Bahn-Stationen zu sehen und beinhaltet redaktionelle Beiträge zu aktuellen, vor allem regionalen Themen. Werbeeinblendungen sind hier nicht aufgenommen worden.
Repräsentativ für das Fahrgastfernsehen in Hannover; zum Zeitpunkt der Erhebung überregional für Norddeutschland. Erhebung: ein Quartal lang an jedem zweiten Tag jede zweite Meldung.
Erhebungszeitraum: 15.05.2005-15.08.2005
Durchsuchbare Belege: 789
Erhebung: © Torsten Siever

Inflektive (Micky Mouse, 1951-1964)

Kurzbeschreibung: Inflektivbelege in frühen Micky-Mouse-Heften (1951-1964) mit Angabe von Erstbelegstatus; dazu sind die Geschehnisse im Bild parallel zum Beleg ausgewiesen.
Vollkorpus
Erhebungszeitraum: 01.01.1951-31.12.1964
Durchsuchbare Belege: 1712
Erhebung: © Peter Schlobinski
Download: Korpus herunterladen (PDF)

Kleinanzeigen der deutschen Tagespresse (1955)

Kurzbeschreibung: Kleinanzeigen aus dem Jahr 1955 aus der Süddeutschen Zeitung, der Frankfurter Allgemeinen Zeitung sowie der Hannoverschen Allgemeinen Zeitung. Beschränkt wurde die Erhebung auf Kleinanzeigen der Rubrik "Verschiedenes", d.h. Anzeigen für Immobilien, Bekanntschaften oder den Automarkt wurden nicht berücksichtigt.
Repräsentativ für unspezifische Kleinanzeigen der Rubrik "Verschiedenes" deutscher Tageszeitungen aus dem Jahr 1955. Erhebung: ein Quartal lang an jedem Samstag 20 Anzeigen (Auswahl: von y Anzeigen jede x. bei x=y/20).
Erhebungszeitraum: 14.05.1955-13.08.1955
Durchsuchbare Belege: 675
Erhebung: © Torsten Siever

Kleinanzeigen der deutschen Tagespresse (2005)

Kurzbeschreibung: Unspezifische Kleinanzeigen aus der Süddeutschen Zeitung, der Frankfurter Allgemeinen Zeitung sowie der Hannoverschen Allgemeinen Zeitung. Beschränkt wurde die Erhebung auf Kleinanzeigen der Rubrik "Verschiedenes", d.h. Anzeigen für Immobilien, Bekanntschaften oder den Automarkt wurden nicht berücksichtigt.
Repräsentativ für unspezifische Kleinanzeigen der Rubrik "Verschiedenes" deutscher Tageszeitungen. Erhebung: ein Quartal lang an jedem Samstag 20 Anzeigen (Auswahl: von y Anzeigen jede x. bei x=y/20).
Erhebungszeitraum: 15.05.2005-15.08.2005
Durchsuchbare Belege: 771
Erhebung: © Torsten Siever

Nachrichtenticker EinsExtra (ARD digital)

Kurzbeschreibung: Nachrichtenticker des digitalen Info-Kanals EinsExtra (ARD). Die Kurznachrichten werden eingeblendet im linken Bildschirmrand im Rahmen eines Split-Screens, während im Hauptbereich (oben rechts) das reguläre Programm läuft.
Repräsentativ für den Nachrichtenticker auf ARD digital (die Erhebung erfolgte alle zwei Tage innerhalb des Zeitraums von vier Wochen).
Erhebungszeitraum: 15.02.2006-15.03.2006
Durchsuchbare Belege: 161
Erhebung: © Torsten Siever

Schülerbriefe (Handzettel)

Kurzbeschreibung: Zettel unterschiedlicher Größe und Form, die vornehmlich während des Unterrichts verfasst, zusammengefaltet und weitergereicht werden.
Nicht repräsentativ (gesammelte Briefe einer Schülerin in der Region Hannover).
Erhebungszeitraum: 01.01.1995-31.12.2004
Durchsuchbare Belege: 190
Erhebung: © Torsten Siever

Science-Fiction-Wörter

Kurzbeschreibung: Die Wörter entstammen Science-Fiction-Literatur. Die Auswahl der zugrunde liegenden Texte repräsentiert einen breiten Querschnitt des Genres. Frühe Autoren wie Jules Verne, H.G. Wells oder Hugo Gernsback sind ebenso vertreten wie aktuelle Vertreter der Science-Fiction, etwa Charles Stross, Justina Robson, Alastair Reynolds oder Adam Roberts. Als Lemmata für die Einträge unseres Lexikons haben wir in erster Linie solche Wörter ausgewählt, die für den jeweiligen Quellentext besonders wichtig oder aussagekräftig sind, genretypische Motive benennen oder charakteristischen Wortbildungsmustern des Genres folgen, darüber hinaus aber auch Wörter, die den Einfallsreichtum von Science-Fiction-Autoren in seiner ganzen Breite anschaulich werden lassen. Viele Einträge enthalten weitere, auf die Lemmata bezogene Neubildungen, so dass insgesamt eine breite Materialbasis präsentiert werden kann.
Nicht repräsentativ, aber umfangreiche Auswahl von 1380 aus mehr als 15.000 Wörtern.
Erhebungszeitraum: 01.01.2007-30.06.2008
Durchsuchbare Belege: 1375
Erhebung: © Peter Schlobinski & Oliver Siebold
Download: Korpus herunterladen (PDF)

SMS-Mitteilungen Hannover

Kurzbeschreibung: SMS-Mitteilungen von vorwiegend Schülern und Studenten in Hannover (Schule, Universität, Sportverein). Suchergebnisse und Wortindizes können auf Altersgruppe und/oder Geschlecht eingeschränkt werden.
Nicht repräsentativ, aber umfangreiches Korpus mit 738 Mitteilungen.
Erhebungszeitraum: 01.04.2001-30.09.2001
Durchsuchbare Belege: 738
Erhebung: © Peter Schlobinski et al.
Download: Korpus herunterladen (PDF)

SMS-Mitteilungen Osnabrück

Kurzbeschreibung: SMS-Mitteilungen von vorwiegend Schülern und Studenten in Osnabrück (Mensa, Ratsgymnasium und Carolinum)
Nicht repräsentativ, aber umfangreiches Korpus mit 673 Mitteilungen.
Erhebungszeitraum: 01.01.2000-31.12.2000
Durchsuchbare Belege: 673
Erhebung: © Peter Schlobinski et al.
Download: Korpus herunterladen (PDF)

Twitter

Kurzbeschreibung: Twitter.com ist ein Dienst im Microblogging-Web, mit dem max. 140 Zeichen lange Mitteilungen auf verschiedene Weise (Web, SMS etc.) online gestellt werden können.
Die zwar nicht repräsentative, aber zufallsauswahlbasierte Erhebung umfasst jeweils 320 Einträge von 32 als männlich und 32 als weiblich ausgewiesenen Personen (= 64), die über zufällig ausgewählte Vornamen ausgesucht wurden, zehn Nachrichten pro Person. Mit Beginn der aktuellsten Nachricht (4.5.2009) wurde jede sechste Nachricht ausgewählt.
Erhebungszeitraum: 14.01.2009-04.05.2009
Durchsuchbare Belege: 640
Erhebung: © Torsten Siever & Peter Schlobinski

Zeitungsartikel

Kurzbeschreibung: Zeitungsartikel (Berichterstattung) von Online-Angeboten der SZ, HAZ und FAZ (sueddeutsche.de, haz.de, faz.net) im Umfang von rund 1500 bis 3000 Zeichen jeweils aus den Rubriken Politik, Wirtschaft, Sport und Feuilleton.
Nicht repräsentative Zusammenstellung von jeweils vier Artikeln pro Zeitung.
Erhebungszeitraum: 13.09.2008-14.09.2008
Durchsuchbare Belege: 12
Erhebung: © Torsten Siever

Ihre Meinung

Kommentare zu dieser Seite

Bewerten Sie die Seite per Klick! erstellt: 30.03.2013 von si aktualisiert: 17.04.2013