Eine mögliche Urheimat der indogermanischen Sprechergemeinschaft

und ihre Wanderwege nach der erweiterten Trennmengenmethode (Separation Level Recovery under Two Distributions, SLR2D)

                           >Version française>               >English Version

Von Hans J. J. G. Holm

0. Die meisten gebildeten Menschen haben zumindest eine grobe Vorstellung von den 'indogermanischen' (idg.) Sprachen: Es sind die vielen durch gemeinsam ererbtes Vokabular (z.B. Zahlensystem, Pronomina) und Grammatik verbundenen Sprachen, die vom Nordwesten Europas bis zum indischen Subkontinent (historisch sogar bis Xinjiang im Nordwesten Chinas) gesprochen werden. Über Grundlagen informieren die großen Lexika in ihrer Bibliothek - die einschlägigen Wikipediaseiten sind Substandard. Zu warnen ist vor den vielen Internetseiten unseriöser, esoterischer Spinner ohne das erforderliche Hintergrundwissen in Indogermanistik, Archäologie, und Statistik (weiteres vgl. Holm 2007b passim), oft erkennbar an Zitierungen weniger Sekundärquellen oder Rassenunsinn.

1. Worüber hier vor allem noch gestritten wird, ist die Herkunft und prähistorische Entwicklung dieser Sprachfamilie in chronologischer, geografischer und neuerdings auch populationsgenetischer Hinsicht. In diesen Diskussionen begegnen wir immer wieder der oberflächlichen Annahme, dass Sprachen umso näher verwandt sind, je mehr Merkmale sie noch gemeinsam haben, ohne zu bemerken, dass diese u.a. (!) von den verwandtschaftsunabhängigen Ersetzungen nach der jeweiligen Abtrennung (s. Holm 2003) bestimmt werden. Es sollte doch einsichtig sein, dass Sprachen mit starken Verlusten (wie Albanisch und Armenisch) trotz enger Verwandtschaft aufgrund der kleineren Datenbasis natürlich weniger Gemeinsamkeiten aufweisen als sogenannte Großkorpussprachen, wie Griechisch oder Indisch.

1.1. Dieses Problem kann nur durch die in der Statistik unabdingbare Beachtung der - hier hypergeometrischen - Datenverteilung gelöst werden. Durch eine solche verteilungsgerechte "SLRD-Transformation" (für Englisch Separation Level Recovery accounting for the Distribution) schätzen wir die ursprüngliche, im Zeitraum der Trennung jedes Sprachenpaares anzunehmende Merkmalsmenge, kurz "Trennungsmenge". Diese Mengen wurden in Holm (2000) für 91 Paarungen zwischen 14 belegten idg. Sprachzweigen publiziert.

1.2. Da nun die Anzahl originaler sprachlicher Merkmale im Laufe der Zeit nur abnehmen kann, z.B. durch geschichtliche Einflüsse, ergibt sich eine klare Ausgliederungsreihenfolge (NICHT "Glottochronologie"), die durch einen sogenannten >"Stammbaum" veranschaulicht wird, hier am Beispiel der jeweils ältesten Form der Wörter für 'Hand' in den zwölf Hauptzweigen der indogermanischen Sprachfamilie. Diese Ausgliederungsreihenfolge ist zunächst nur ein Schema und muss dann auf die verschiedenen Vorstellungen der ("Urheimat") angewendet werden, natürlich einschließlich der notwendigen Wanderbewegungen.

1.3. Die linguistisch (als Lehn- oder gar Erbmerkmale) erschlossenen frühen Kontakte der indogermanischen mit den uralischen Sprachen legen eine Urheimat in den eurasischen (Wald)Steppengebieten nahe. Meinen Vorschlag für die von dort ausgehend anzunehmenden Migrationen gibt diese >Ausbreitungskarte wieder. Es muss aber bemerkt werden, dass die Wanderwege bisher nicht überzeugend bewiesen werden konnten.

2. Zur Zeitfrage: Rechnen wir chronologisch vom am frühesten bezeugten Auftreten der Hethiter zurück, scheint klar, dass die indogermanische Ausbreitung in etwa parallel mit der Ausbreitung der Metallurgie, von Ochsengespannen und überhügelten Gräbern stattfand. Was nicht unbedingt bedeuten muss, dass die Indogermanen diese Techniken und Sitten erfunden hätten, aber sie zumindest intensiv angewandt haben. Als Hirtennomaden mit hohem Anteil an Pferden sollten sie auch gute Reiter gewesen sein, was natürlich auch einen ausschlaggebenden militärisch-taktischen Vorteil beinhaltet. Zu Beginn des Pferdereitens hatte man vermutlich gebissloses oder nur nichtmetallisches und damit archäologisch kaum nachweisbares Zaumzeug, damit früher zu datieren als die erst mit dem Aufkommen metallener Trensen nachweisbare Gebissabnutzung. Da all diese Erfindungen nicht zwingende, sondern nur förderliche Bedingungen für Migrationen darstellen, könnten Letztere sowohl in kürzerer Zeit, oder auch etwas früher oder später stattgefunden haben.

3. Ein weiterer Diskussionspunkt ist die Frage, ob die sogenannten Anatolischen Sprachen, insbesondere Hethitisch,
- noch Vollmitglieder eines Ur-Indogermanisch waren;
- oder das letztere seine endgültige Ausprägung erst nach Abwanderung des Hethitischen vollendet habe.
4. Die augenblicklich modischen Stammbaum-Rekonstruktionen durch mechanistische Anwendung von Computer-Programmpaketen aus der Biosystematik neigen oft zu mindestens einer der folgenden irrigen Annahmen:
4.1. Einige kladistisch Forschende gehen einfach a priori davon aus, dass das Hethitische die endgültige Entwicklung des IE nicht geteilt habe, verwenden diese Sprache als sogenannte "Outgroup", und unterliegen dann dem Zirkelschluss, Hethitisch sei der natürliche Ausgangspunkt ihres ursprünglich wurzellosen (!) Graphen!

4.2. Sie folgen dem primitiven Ähnlichkeits-Prinzip - Sprachen seien näher verwandt, je mehr "Kognaten" sie teilen (irrig mit 'evolutionärer Distanz' gleichgesetzt), unter völliger Missachtung der in [1] dargestellten realen Abhängigkeiten ('Proportionalitätsfalle' - vgl. Ref. Holm (2003)).
4.3. Oder sogar der Annahme, dass Wörter "nach der Uhr" ausgetauscht würden, was offensichtlich falsch ist und nur Anfangsfehler der Glottochronologie fortsetzt: Kontrollieren Sie bitte irgendein Wort in einem etymologischen Wörterbuch und versuchen Sie, seine Geschichte zurückzuverfolgen: Es wird nie ein zeitlicher Automatismus sein, sondern - entsprechende Geschichtskenntnisse vorausgesetzt - eben historisch bedingte (kulturelle, technische, oder militärische) Ereignisse, die niemand vorhersehen oder gar berechnen kann. Z.B. ist im Englischen ca. 50 % des ursprünglich altsächsischen Vokabulars nicht "nach der Uhr" ersetzt worden, sondern, wie jeder geschichtlich etwas Gebildete weiß, durch die normannische Dominanz nach deren Sieg bei Hastings, neben einem langen lateinischen Bildungshintergrund in Kirche und Wissenschaft. Dass im "lexikostatistischen Prüfwortschatz" diese Ersetzungen graduell geringer ausfallen, ändert nichts an der Unberechenbarkeit ihrer sozio-historischen Ursachen; selbst in Swadeshs gut erforschter englischer 100-Wörter-Testliste wurden z.B. mindestens 6 % Entlehnungen aus nordischen Wikingerdialekten von manchen "Experten" nicht bemerkt (vgl. u.a. Holm 2007c). Man kann Journalisten nicht vorwerfen, dass ihnen diese Zusammenhänge zunächst verborgen bleiben. Doch von Wissenschaftlern sollte erwartet werden können, dass sie sich um Hintergründe und Kausalitäten bemühen, statt diese mechanistischen Vergleiche blind zu übernehmen.
--------



 5. Publikationen: (Weiteres siehe auch Google Scholar, Academia.edu, und Reserachgate.Net)
ORCID iD iconorcid.org/0000-0001-9527-0553 - Holm, Hans J.J.G. (2022): Meine "Holms universale lexicostatistische Testliste" ist eine modifizierte Version der letzten Ausgabe von M. Swadesh (1971 posthum). Ihre sogenannten "unmarkierten" Übersetzungen in 17 repräsentativen ausgestorbenen und lebenden indogermanischen Sprachen ergeben 870 verschiedene Wortstämme. Basiert auf etwa 160 Referenzen. Die Arbeit kann auf Anfrage an meine unten angegebene e-mail zugesandt werden. - Entwickelt für lexikostatistische Arbeiten zu den 12 indogermanischen Hauptzweigen! - Hans J.J.G. Holms laufende Kartennotizen der (Vor-)geschichte - von der Biskaja bis zum Kaspischen Meer - von der Eiszeit bis zum Mittelalter; in 27 Zeitscheiben, jeweils mit laufender Klimaleiste (auf Basis Holm 2011a) und laufender Kulturenleiste. Meist Deutsch, oft Quellsprache. Blättern Sie durch >Holms historische Zeitscheiben. - Eine aktuelle Version kann auf Anforderung zugesandt werden - Holm, Hans J. J. G. (2019): The Earliest Wheel Finds, their Archeology and Indo-European Terminology in Time and Space, and Early Migrations around the Caucasus. Mit 306 Quellennachweisen, 6 überwiegend farbigen Abbildungen im Text, sowie verkleinerten Abbildungen von 130 repräsentativen Radfunden (dabei aktuelle - Erfanden die Indogermanen das Rad? aus Deutschland und China). Series Minor 43. Budapest: ARCHAEOLINGUA ALAPÍTVÁNY. ISBN 978-963-9911-30-5. Bitte finden Sie die Verfügbarkeit in Google!
[Zusammenfassung : Die Rolle, die das Wagenrad im Leben der Indogermanen spielte, wurde bisher vor allem aus der Sicht von Spezialisten untersucht, oft ohne ausreichende Berücksichtigung betroffener Nachbardisziplinen. Wir recherchierten nun die ältesten Radfunde (vor ca. 2000 v.Chr.) und stellen eine repräsentative Auswahl von 130 Funden zwischen der Nordsee, Zentralasien und Indien sowohl tabellarisch als auch geographisch vor. Anschließend haben wir die fünf Radbezeichnungen der indogermanischen Hauptfamilien heraus- gearbeitet, insbesondere im Hinblick auf onomasiologische Aspekte. Um beide Ergebnisse mit der Entwicklung der indogermanischen Sprachen in Beziehung setzen zu können, greifen wir auf ein aktuelles glottochronologisches Gerüst zurück. Dies führt bereits zu Erkenntnissen über das Alter einiger Bezeichnungen sowie zu deutlichen Parallelen mit bestimmten Konstruktionsarten. Darüber hinaus werden vor diesem aktualisierten Hintergrund zwei häufig diskutierte Fragen behandelt. Zum einen gibt es bezüglich der Trennung der (indogermanischen) Anatolier und Tocharer viele Hinweise darauf, dass diese im Kaukasus vom östlichen Hauptast aus stattgefunden hat. Des Weiteren werden die Hypothesen für die "Erfindung" des Rades durch den weitaus realistischeren Vorschlag einer langanhaltenden Entwicklung in einem weiten Kommunikationsnetz ersetzt.] Richtigstellung: Ich entschuldige mich für den Tippfehler in Fußnote 5, richtig ist "S(usanne) Kuprella".
- Holm, Hans J. (2017): Steppe Homeland of Indo-Europeans Favored by a Bayesian Approach with Revised Data and Processing. Glottometrics 37, 54-81. Bochum: Ram-Verlag. Open access http://www.ram-verlag.eu/journals-e-journals/glottometrics/                 - Verschiedene Teste eines Bayes'schen Ansatzes mit eigener Swadeshliste, im Vergleich mit Radbezeichnungen und Archäologie.
[Zusammenfassung: Trotz Dutzender Hypothesen werden Ursprung und Ausbreitung der indo- germanischen Sprachen weiterhin kontrovers diskutiert. Ein in Science (2012/2013) erschienener glottochronologischer Ansatz unter Bayes'scher Methodik beanspruchte, die Gleichzeitigkeit mit der neolithischen Expansion erbracht und damit die sogenannte „Anatolien-Hypothese“ bewiesen zu haben. Die Ergebnisse stoßen jedoch auf Kritik seitens anderer Disziplinen. Wir gehen hier den angeblichen Beweisen für die berechneten Zeiten durch Replikation der veröffentlichten Methodik unter Einsatz eines eigenen, verbesserten Datensatzes auf den Grund. Daraus ergab sich zunächst ein Ursprung bei etwa 4800 v.Chr., wobei allerdings die Struktur der Stammbäume in mehreren hundert Tests erheblich variierte. Diesem Problem begegneten vorhergehende Arbeiten durch scharfe topologische Vorgaben. Weil Verben bekanntermaßen am wenigsten anfällig gegen Entlehnungen sind, entschied ich mich dazu, einen Stammbaum aus dem besten dazu verfügbaren indogermanischen Datensatz mit über 1.100 Verbalwurzeln, der zunächst keine Chronologie beinhaltete, als "cladistic constraints" vorzuschlagen. Dies ergab eine erste (West-Ost-)Aufspaltung bei einem Mittelwert von 4100 v.Chr. Während dieser Teste erbrachte ein weiterer, in Language (2015) erschienener Ansatz Ursprungsdaten zwischen 3950 – 4740 v.Chr. Dort wurde davon ausgegangen, dass frühere Ergebnisse durch schlecht belegte Zwischenstufen verfälscht gewesen seien, die man versuchte, schrittweise zu korrigieren. Der hier erhaltene Stammbaum spiegelt einige neue Erkenntnissen aus Linguistik, Archäologie und Genforschung, die zugunsten der Steppenhypothese sprechen. Vor allem zeigt eine neue archäologisch- linguistische Gegenüberstellung, dass verschiedene indogermanische Wagenradbezeichnungen mit verschiedenen Konstruktionstypen in den entsprechenden Sprachräumen korrelieren. Zum Schluss werden die auf den möglichen Ausbreitungswegen und -zeiten liegenden archäologischen "Kulturen" als Overlay über den berechneten Stammbaum gelegt, ohne allerdings damit in jedem Fall deren indogermanischen Charakter zu postulieren.]
- Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2.         - Englische, leicht verbesserte Version (>Corrigenda (inaktiv))
[Abstract: In the last decade, several scholars pretended to have finally solved the subgrouping of Indo-European by new lexicostatistical attempts. The public, of course, was not able to perceive the questionable outcomes, of which the different and idiosyncratic positions of Albanian are in particular conspicuous. One reason for this is the inadequate methods, simply copied from bioin- formatics (cf. Holm, H. J. 2007b). That defective data contribute a lot to these mistakes, is now here first demonstrated by analyzing the Albanian part of three representative lists frequently employed in these studies: The presumably thirteen percent mistakes there mix inextricably with the overlooked stochastic dispersion. Seventeen new etymologies are proposed, however, thirty percent of the list remain unsolved or questionably. Moreover, the high amount of recent replacements in Albanian is one more compelling argument against the rate assumption in glottochronology.] (Deutsche Zusammenfassung siehe 2009)
- Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies").         - Klimaänderungen im Mittel- und Spät-Holozän in Eiskernen Grönlands und alpinen Baumgrenzen - Archäologisches Korrespondenzblatt 41-1:119-132. (Hintergrundwissen für mögliche Ursachen von Migrationen) Das PDF finden Sie hier: >Holms Archäoklimatologie.
[Schmidt/Gruhle stellen mit ihrer sogenannten "Wuchshomogenität" - hier: mitteleuropäischer Eichenstandorte - einen guten Indikator für feucht-warme gegenüber trocken-kalten Jahren vor. Dies erweist sich zumindest für den nordatlantischen Bereich durch die relativ gute Korrelation sowohl mit den Schwankungen der Baumgrenzen in den Alpen als auch mit den aus grönländischen Eiskernbohrungen ablesbaren Temperaturverläufen. Dagegen erweist sich die behauptete gute Korrelation mit der Sonneneinstrahlung (Insolation) als Ergebnis zu kurzfristiger Betrachtungen oder sogar fehlerhafter Interpretation der Sonnenaktivität.]
- Holm, Hans J. (2010): Rezension zu Frank Sirocko (Hg.), "Wetter, Klima, Menschheitsentwicklung, Von der Eiszeit bis ins 21. Jahrhundert". Hier: >Falsche historische Klimabeziehungen. - Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen in den indo- germanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden, Harrassowitz: 171-205. - Kritische Analyse einiger in lexikostatistischen Arbeiten benutzter Wortlisten - Verfügbar über >online       (Anmerkung: Heute würde ich den irreführenden Ausdruck "Basiswortliste" durch "Universale Testbegriffsliste" ersetzen)
[Zusammenfassung: In der vergangenen Dekade hat eine Reihe von Wissenschaftlern den Anspruch erhoben, mittels neuer lexikostatistischer Verfahren die Untergliederung der indogermanischen Sprachen gelöst zu haben. Von der Öffentlichkeit konnte indes nicht erwartet werden, die Fragwürdigkeit dieser Ergebnisse zu erkennen, wobei die unterschiedlichen und z.T. idio- synkratischen Einordnungen des Albanischen besonders auffallen. Einer der Gründe hierfür liegt sicher in der Unangemessenheit der oft aus der Bioinformatik übernommenen Methodik (vgl. Holm, H. J. 2007, The new Arboretum of Indo-European ‘Trees’, in: Journal of Quantitative Linguistics, 14-2). Dass zusätzlich in erheblichem Maße Datenfehler vorliegen, wird hier anhand des albanischen Teils von drei häufig zu diesen Studien herangezogenen Listen nachgewiesen: Im Ergebnis bilden die etwa dreizehn Prozent Fehler eine Mischung mit der vernachlässigten stochastischen Streuung. Es werden siebzehn neue Etymologien vorgeschlagen, doch bleiben immer noch etwa dreißig Prozent des albanischen Grundwortschatzes von unklarer Herkunft. Dies und der stark wechselnde Einfluss von Entlehnungen bilden letztlich ein weiteres Argument gegen die glottochronologische Grundannahme fester Ersetzungsraten.]
- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. In: C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (Editors): Data Analysis, - Lösung verteilungsbedingter Probleme plus verb-basierte Machine Learning, and Applications. Proceedings of the 31th Annual Conference of the Gesellschaft = entlehnungsminimierte Datenbasis für Klassifikation e.V., Albert-Ludwigs-Universität Freiburg, März 7-9, 2007. Springer-Verlag, -> verbesserter idg. "Stammbaum" - Heidelberg-Berlin: 629-636. ISBN 978-3-540-78239-1. Das Manuskript finden Sie hier >Holm SLRD Freiburg.pdf.
[Zusammenfassung: Linguisten pflegten anzunehmen, dass Sprachen desto näher verwandt sind, je mehr Merkmale, insbesondere gemeinsame Neuerungen, sie teilen. In Holm (2003) wurde gezeigt, dass diese Annahme schnell in die Irre führen kann, weil übersehen wird, dass stochastisch die Menge gemeinsamer Übereinstimmungen von drei weiteren Parametern abhängt. Mittels des 'maximum likelihood Schätzers' der 'Hypergeometrischen Verteilung' konnten wir die Anzahl derjenigen Merkmale berechnen, die im Zeitraum der Trennung zweier Sprachen diesen noch gemeinsam eigen war. Damit konnte eine Ausgliederungsreihenfolge innerhalb solcher Sprachfamilien gewonnen werden, für welche die erforderlichen Daten verfügbar waren. Mittels der Daten des Indogermanischen Etymologischen Wörterbuchs (IEW, Pokorny 1959) waren die sich ergebenden späten Ausgliederungen des Hethitischen, Albanischen und Armenischen zwanglos mit deren zentraler geographischen Lage erklärbar und daher unverdächtig. Erst, als in einer weiteren Anwendung mit Daten der Mixe-Zoque-Familie beobachtet wurde, dass die am schlechtesten belegten Sprachen stets spät auszugliedern schienen, konnte ein systematischer Fehler vermutet werden. Hier wird die Ursache dieses Fehlers aufgedeckt, der nur bei Merkmalslisten natürlicher Sprachen auftritt, im Gegensatz zu den in Holm (2007a) benutzten Testlisten mit stochastisch normalverteilten Daten. Zudem stand für diese Untersuchung nun als erheblich zuverlässigere Datenquelle das "Lexikon der indogermanischen Verben" (Rix et al. 2001) zur Verfügung. Vor allem wird hier erstmalig die bei allen anderen Datenbanken immanente Verfälschung aufgrund von Entlehnungen durch die ausschließliche Verwendung von Verben minimiert, die bei Weitem weniger entlehnt werden als andere Wortarten. In der Tat bewahrheitete sich der Verdacht, und es wird gezeigt, wie aus solchen quasi- Pareto-verteilten Daten trotzdem die korrekte Ausgliederungsreihenfolge gewonnen werden kann. Es ergibt sich eine (teilweise) neue Ausgliederungsreihenfolge der indogermanischen Hauptzweige, die gut zu den grammatischen Tatsachen als auch der geographischen Verteilung passt. Vor allem ergibt sich klar, dass sich die anatolischen Sprachen keinesfalls als erste getrennt haben können und widerlegt damit eindeutig die "indo-hethitische Hypothese".]
- Holm, Hans J. (2007d): Ausgliederungsreihenfolge der Indogermania auf Grundlage des LIV2. - Zielgruppe: Deutsche Linguisten Vortrag beim Institut für vergleichende Indogermanistische Sprachwissenschaft der Universität Bonn. Hier gibt's den Dia-Vortrag als pdf: >Holm Idg. Ausgliederung Bonn.
- Holm, Hans J. (2007c): The Distribution of Data in Word Lists and its Impact on the Subgrouping of Languages. Vortrag für die Gesellschaft f. Klassifikation, Univ. Freiburg - Zielgruppe: "Quantitative Linguisten", Statistiker v. 7.-9. März 2007. Die Vortrags-Dias als pdf: >Holm Wortverteilungen und ihre Folgen, Freiburg.
- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees" - Can new Algorithms Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative Linguistics 14-2, S. 167-214. -> in D verfügbar in vielen Uni-Bibliotheken. Original-Kopien über http://cats.tfinforma.com/PTS/in?t=rl&m=237780. Den Entwurf finden Sie hier >Arboretum IE trees. - Aktualisierung auf 2006, neuere lexikostatistische Ansätze
[Zusammenfassung: Die Spezialisierungen auf den Gebieten der Linguistik einerseits und der Bioinformatik andrerseits führen zunehmend zu Missverständnissen und falschen Ergebnissen, bedingt durch unzureichende Kenntnis der Bedingungen der jeweils ange- wandten Methoden und Materialien. Diese werden analysiert und die Ergebnisse zur Beurteilung der augenblicklichen Schwemme von Versuchen zur Konstruktion neuer Stammbäume der indogermanischen Sprachen herangezogen.]
- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors), Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel Altmann on the occasion of his 75th birthday. [Quantitative Linguistics 62]. Berlin: De Gruyter: 225-235. - Umgang mit stat. Streuungen in mehrstufigen Untergliederungen
[Zusammenfassung: Nach mehreren Jahren der Erprobung, und angesichts vieler konkurrierender Verfahren, wird die Trennmengenberechnungsmethode (Holm 2000, passim) im Hinblick auf ihre Erfordernisse verfeinert. Es wird getestet, wie stochastische Streuung von schlechten Daten unterschieden werden kann und welche Anforderungen Daten erfüllten sollten.]
- Holm, Hans J. (2005): Genealogische Verwandtschaft. Kapitel 45 in Köhler, R., Altmann, G. & Piotrowski, R., 'QUANTITATIVE LINGUISTIK' - Ein internationales Handbuch [HSK-Serie, Bd. 27], Berlin; New York: De Gruyter Mouton. doi.org/10.1515/9783110155785 - Die lexikostatistischen Ansätze zur Gliederung von Sprachen im 20.Jh. Weiteres s.o. 2008 -
[Inhalt: 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße; 3.1. Synchrone ~; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer Abhängigkeiten.]
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with lexicostatistical subgouping? In: Indogermanische Forschungen 108: 39-47.                       - Grundlagen auf Englisch; auch für Nicht-Mathematiker geeignet -
[Zusammenfassung: Es wird anhand eines Experiments gezeigt, dass die rohe Anzahl von Übereinstimmungen (z.B. der Kognaten) zwischen zwei verwandten Sprachen prinzipiell nicht den Grad der genealogischen Verwandtschaft wiedergeben kann. Anschließend wird demonstriert, wie durch Berücksichtigung aller statistisch bestimmenden Parameter die unterschiedliche Ausgangsbasis der Paarungen und damit die korrekte Ausgliederungsreihenfolge wieder hergestellt werden kann.]
- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical Foundations of Linguistics' (by Hubey, H.Mark, 1999, LINCOM handbooks in Linguistics 10, München: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.  - Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95. Einige Abbildungen fand ich noch in >Holm Sep Base Meth Abbildungen                            -Anwendung auf Pokornys Indogermanisches Etymologisches Wörterbuch; Aktualisierungen s.u. 2007a,b -
[Zusammenfassung: In bisherigen quantitativen Analysen der genealogischen Beziehungen zwischen Sprachen wurde der durch Ersetzungen bedingte systematische Fehler nicht angemessen eliminiert, was nur zu falschen Ergebnissen führen konnte. Erst dank der Auszählung der riesigen und damit statistisch erst signifikanten Datenmenge aus J. Pokorny „Indogermanisches Etymologisches Wörterbuch“ (Bern: Francke, 1959), in: N. Birds „Distribution of Indo-European root morphemes“ (Wiesbaden: Harrassowitz, 1982) war es trotz einiger bekannter Mängel möglich, die Anzahl der Lexeme im Zeitraum der Trennung jedes Sprachenpaares mit Hilfe eines robusten Schätzers zu berechnen und damit die Ausgliederungsreihenfolge zu erschließen. Die üblichen Schwarz-Weiß-Hypothesen, z.B. pro oder kontra eine italo-keltische Verwandtschaft, können den realen Entwicklungen nicht gerecht werden und sollten diesen differenzierteren Ergebnissen Platz machen.]
 
------------

Started 2010-05-27:
free counters