Sharp PW-E420 operation manual Zum Umfang des deutschen Wortschatzes

Page 48

Bei den Zahlen, die sich im Folgenden auf das Dudenkorpus beziehen, unterscheiden wir zwischen den Wortformen, wie sie in einem Fließtext vorkommen, und den mittels einer (maschinellen) Analyse auf ihre Grundform zurückgeführten Wortformen.

Unter einer Wortform verstehen wir jedes einzelne Wort eines Fließtextes. Dieses kann, je nach Wortart, entweder gebeugt oder ungebeugt vorkommen. Der Satz Sie versprach, den Betrag gutzuschreiben beispielsweise besteht aus den Wortformen »Sie«, »versprach«, »den«, »Betrag« und »gutzuschreiben«.

Die Grundform eines Wortes ist zum Beispiel bei Verben der Infinitiv, bei Substantiven normalerweise der Nominativ Singular oder bei Artikeln der Nominativ Singular. Die Grundformen zu dem oben angeführten Beispiel lauten «sie«, »versprechen«, »der«, »Be-trag«, »gutschreiben«. Diese Grundformen sind gleichzeitig auch die Stichwörter, die in einem Wörterbuch wie dem Duden verzeichnet sind.

Wortform im Korpus

Grundform im Korpus/Stichwort im Duden

Sie

sie

versprach

versprechen

den

der

Betrag

Betrag

gutzuschreiben

gutschreiben

In einem Wörterbuch kommt jedes Stichwort normalerweise nur einmal vor. In einem Text hingegen können Wortformen mehrmals vorkommen, so zum Beispiel in dem Satz:

»Wer täglich das tut, was täglich getan werden muss, hat viel zu tun.«

Aus wie vielen Wörtern besteht dieser Satz? Beim einfachen Zählen kommt man auf 13; zählt man aber nur die verschiedenen Wörter, sind es nur 12, denn »täglich« kommt zweimal vor. Reduziert man alle Wörter auf ihre Grundform und zählt nur, wie viele verschiedene Grundformen es gibt, dann heißt das Ergebnis 10, denn »tun« kommt dreimal (in den Formen tut, getan, tun) vor.

Wenn in diesem Kapitel die Rede von Wortformen und Grundformen ist, ist mit Wortformen immer die erste Zählweise (13), mit Grundformen immer die letzte Zählweise (10) gemeint.

Zum Umfang des deutschen Wortschatzes

Exakte Angaben über den Umfang des deutschen Wortschatzes sind nicht nur deshalb unmöglich, weil ständig Wörter neu gebildet und aus anderen Sprachen entlehnt werden. Eine genaue Feststellung wird auch dadurch erschwert, dass die Abgrenzung der festen Bestandteile unseres (Allgemein)wortschatzes von den Situations- oder Gelegenheitsbildungen (etwa »Autohimmel« in dem Satz »Der neue Sportwagen ist ein Stern am Autohimmel «) und den fach- und sondersprachlichen Wörtern nicht möglich ist. Im Allgemeinen setzt man den Wortschatz der deutschen Gegenwartssprache auf zwischen 300 000 und 500 000 Wörter (Grundformen) an. Der aktive Wortschatz eines deutschen Durchschnittssprechers wird heute auf 12 000 bis 16 000 Wörter (davon etwa 3 500 Fremdwörter) geschätzt. Ohne Schwierigkeiten verstanden werden mindestens 50 000 Wörter.

Der Rechtschreibduden enthält rund 140 000 Stichwörter, das »Deutsche Wörterbuch« (1852–1971) von Jacob und Wilhelm Grimm etwa 450 000, von denen aber zahlreiche nicht mehr in Gebrauch sind. Das Dudenkorpus hat nach heutigem Stand (Frühjahr 2012) einen Umfang von rund 10 Millionen unterschiedlichen Wörtern (Grundformen). Die enorme Diskrepanz zum Umfang eines Wörterbuchs erklärt sich dadurch, dass die meisten Wörter im Dudenkorpus nur ein- bis wenige Male vorkommen und deshalb keine Aufnahmekandidaten für ein Wörterbuch sind. Es handelt sich dabei oft um Namen oder um mehrteilige Zusammensetzungen, deren Bedeutung sich leicht aus der Bedeutung der einzelnen Bestandteile erschließt (z. B. »Vampirdarstellerin« oder »Vogelschutzgutachten«). Während die einzelnen Bestandteile möglichst lückenlos in einem Wörterbuch wie dem Duden verzeichnet sein sollten, können die vielfältigen Zusammensetzungen, die im Deutschen möglich sind, schon allein aus Platzgründen niemals vollständig in einem gedruckten Wörterbuch enthalten sein.

47

Image 48
Contents PW-E420 Cover1Garantieurkunde für Sharp Electronic Dictionary PW-E420 Introduction Fast and clever Look up and explore Contents Using the PW-E420 for the first time If the power cannot be turned onTurning the power on/off Auto power off functionTo attach a commercially available strap BacklightData contained in the PW-E420 Langenscheidt KG, Berlin und MünchenDisplay symbols Refer to the next page for details LayoutDisplay symbols Key assignmentsOperation guidance message Basic Operation of PW-E420 Inputting words for a dictionary searchIf there is no match found Selecting a dictionary / function in the main menuList view selecting an item scrolling Filter search view selecting an item scrollingDetail view scrolling Shifting the displayed character size ZRecalling the terms previously searched H Setting the key sound on/off Tastenton Set-up Menu Menü-EinstellungenListing a summary of detail view items Q Translating of words from a detail screenAdjusting the LCD contrast LCD-Kontrast Inputting CharactersCharacter entry Modifying entry Deleting unnecessary or incorrect charactersAdding characters Press Bto delete all characters enteredUsing Langenscheidt Englisch- Deutsch Looking up a word by Filter searchPhrase search Feststehende Wortverbindungen suchen Press E List of phrases containing the words appearsWord games Buchstabenrätsel Crossword solver Kreuzworträtsel lösenIf the list of words does not appear as expected Anagram solver Anagramm lösen Further information Using Langenscheidt Deutsch- Englisch Conjugation of French Verbs With irregular French verbs, the verb paradigm isPhrase search Feststehende Wortverbindungen suchen Spellcheck function Rechtschreibprüfung Solver menu appears Further information Using Langenscheidt Deutsch- Französisch Find the information for ‘gelb’ Input screen appears Type in the spelling of ‘gelb’If the list of words do not appear as expected Find a matching word for a query ‘w?rt’ Find anagrams for ‘Lauf’Duden-rules Zusatz-Infos Contents-Info How to view the Zusatz-Infos How to use the Super jump function About the detail view after the JumpInitiate a Super jump search via Langenscheidt Using the My Words List function Displaying the words you have registered in each dictionaryDeleting a My Words List item Deleting the My Words List of a dictionaryHow to use the History function Deleting a history itemDeleting the history list of a dictionary Prior to initiating calculations Setting a currency rate Converting currenciesOne conversion rate can be set Metric converter Metrische Umrechnungen Volumen 5 volume Units capable of being converted⇔ l ⇔ m3Replacing the battery Battery usedPrecautions When to replace the battery Reset procedure if trouble occurs Specifications Reset procedures Troubleshooting Product supportDuden Die deutsche Rechtschreibung VorbemerkungZum Umfang des deutschen Wortschatzes Die Stichwortzahlen der Dudenauflagen Die häufigsten Wörter in deutschsprachigen TextenDie häufigsten Buchstaben in deutschen Wörtern USADie längsten Wörter im Duden Die längsten Wörter im DudenkorpusRang Durchschnittliche Länge eines deutschen Wortes Die Wörter mit den meisten aufeinanderfolgenden VokalenDie Wörter mit den meisten aufeinanderfolgenden Konsonanten Die Verteilung der Wortarten im Rechtschreibduden Die Verteilung der Artikel Genusangabe im RechtschreibdudenMengenmäßig verteilen, zeigt die folgende Grafik Wie die Grafik links zeigt, stellen die