Eine mögliche Urheimat der indogermanischen Sprechergemeinschaft

0. Die meisten gebildeten Menschen haben zumindest eine grobe Vorstellung von den 'indogermanischen' (idg.) Sprachen: Es sind die vielen durch gemeinsam ererbtes Vokabular (z.B. Zahlensystem, Pronomina) und Grammatik verbundenen Sprachen, die vom Nordwesten Europas bis zum indischen Subkontinent (historisch sogar bis Xinjiang im Nordwesten Chinas) gesprochen werden. Über Grundlagen informieren die großen Lexika in ihrer Bibliothek - die einschlägigen Wikipediaseiten sind Substandard. Zu warnen ist vor den vielen Internetseiten unseriöser, esoterischer Spinner ohne das erforderliche Hintergrundwissen in Indogermanistik, Archäologie, und Statistik (weiteres vgl. Holm 2007b passim), oft erkennbar an Zitierungen weniger Sekundärquellen oder Rassenunsinn.

1. Worüber hier vor allem noch gestritten wird, ist die Herkunft und prähistorische Entwicklung dieser Sprachfamilie in chronologischer, geografischer und neuerdings auch populationsgenetischer Hinsicht. In diesen Diskussionen begegnen wir immer wieder der oberflächlichen Annahme, dass Sprachen umso näher verwandt sind, je mehr Merkmale sie noch gemeinsam haben, ohne zu bemerken, dass diese u.a. (!) von den verwandtschaftsunabhängigen Ersetzungen nach der jeweiligen Abtrennung (s. Holm 2003) bestimmt werden. Es sollte doch einsichtig sein, dass Sprachen mit starken Verlusten (wie Albanisch und Armenisch) trotz enger Verwandtschaft aufgrund der kleineren Datenbasis natürlich weniger Gemeinsamkeiten aufweisen als sogenannte Großkorpussprachen, wie Griechisch oder Indisch.

1.1. Dieses Problem kann nur durch die in der Statistik unabdingbare Beachtung der - hier hypergeometrischen - Datenverteilung gelöst werden. Durch eine solche verteilungsgerechte "SLRD-Transformation" (für Englisch Separation Level Recovery accounting for the Distribution) schätzen wir die ursprüngliche, im Zeitraum der Trennung jedes Sprachenpaares anzunehmende Merkmalsmenge, kurz "Trennungsmenge". Diese Mengen wurden in Holm (2000) für 91 Paarungen zwischen 14 belegten idg. Sprachzweigen publiziert.

1.2. Da nun die Anzahl originaler sprachlicher Merkmale im Laufe der Zeit nur abnehmen kann, z.B. durch geschichtliche Einflüsse, ergibt sich eine klare Ausgliederungsreihenfolge (NICHT "Glottochronologie"), die durch einen sogenannten >"Stammbaum" veranschaulicht wird, hier am Beispiel der jeweils ältesten Form der Wörter für 'Hand' in den zwölf Hauptzweigen der indogermanischen Sprachfamilie. Diese Ausgliederungsreihenfolge ist zunächst nur ein Schema und muss dann auf die verschiedenen Vorstellungen der ("Urheimat") angewendet werden, natürlich einschließlich der notwendigen Wanderbewegungen.

1.3. Die linguistisch (als Lehn- oder gar Erbmerkmale) erschlossenen frühen Kontakte der indogermanischen mit den uralischen Sprachen legen eine Urheimat in den eurasischen (Wald)Steppengebieten nahe. Meinen Vorschlag für die von dort ausgehend anzunehmenden Migrationen gibt diese >Ausbreitungskarte wieder. Es muss aber bemerkt werden, dass die Wanderwege bisher nicht überzeugend bewiesen werden konnten.

2. Zur Zeitfrage: Rechnen wir chronologisch vom am frühesten bezeugten Auftreten der Hethiter zurück, scheint klar, dass die indogermanische Ausbreitung in etwa parallel mit der Ausbreitung der Metallurgie, von Ochsengespannen und überhügelten Gräbern stattfand. Was nicht unbedingt bedeuten muss, dass die Indogermanen diese Techniken und Sitten erfunden hätten, aber sie zumindest intensiv angewandt haben. Als Hirtennomaden mit hohem Anteil an Pferden sollten sie auch gute Reiter gewesen sein, was natürlich auch einen ausschlaggebenden militärisch-taktischen Vorteil beinhaltet. Zu Beginn des Pferdereitens hatte man vermutlich gebissloses oder nur nichtmetallisches und damit archäologisch kaum nachweisbares Zaumzeug, damit früher zu datieren als die erst mit dem Aufkommen metallener Trensen nachweisbare Gebissabnutzung. Da all diese Erfindungen nicht zwingende, sondern nur förderliche Bedingungen für Migrationen darstellen, könnten Letztere sowohl in kürzerer Zeit, oder auch etwas früher oder später stattgefunden haben.

3. Ein weiterer Diskussionspunkt ist die Frage, ob die sogenannten Anatolischen Sprachen, insbesondere Hethitisch,
- noch Vollmitglieder eines Ur-Indogermanisch waren;
- oder das letztere seine endgültige Ausprägung erst nach Abwanderung des Hethitischen vollendet habe.
4. Die augenblicklich modischen Stammbaum-Rekonstruktionen durch mechanistische Anwendung von Computer-Programmpaketen aus der Biosystematik neigen oft zu mindestens einer der folgenden irrigen Annahmen:
4.1. Einige kladistisch Forschende gehen einfach a priori davon aus, dass das Hethitische die endgültige Entwicklung des IE nicht geteilt habe, verwenden diese Sprache als sogenannte "Outgroup", und unterliegen dann dem Zirkelschluss, Hethitisch sei der natürliche Ausgangspunkt ihres ursprünglich wurzellosen (!) Graphen!

4.2. Sie folgen dem primitiven Ähnlichkeits-Prinzip - Sprachen seien näher verwandt, je mehr "Kognaten" sie teilen (irrig mit 'evolutionärer Distanz' gleichgesetzt), unter völliger Missachtung der in [1] dargestellten realen Abhängigkeiten ('Proportionalitätsfalle' - vgl. Ref. Holm (2003)).
4.3. Oder sogar der Annahme, dass Wörter "nach der Uhr" ausgetauscht würden, was offensichtlich falsch ist und nur Anfangsfehler der Glottochronologie fortsetzt: Kontrollieren Sie bitte irgendein Wort in einem etymologischen Wörterbuch und versuchen Sie, seine Geschichte zurückzuverfolgen: Es wird nie ein zeitlicher Automatismus sein, sondern - entsprechende Geschichtskenntnisse vorausgesetzt - eben historisch bedingte (kulturelle, technische, oder militärische) Ereignisse, die niemand vorhersehen oder gar berechnen kann. Z.B. ist im Englischen ca. 50 % des ursprünglich altsächsischen Vokabulars nicht "nach der Uhr" ersetzt worden, sondern, wie jeder geschichtlich etwas Gebildete weiß, durch die normannische Dominanz nach deren Sieg bei Hastings, neben einem langen lateinischen Bildungshintergrund in Kirche und Wissenschaft. Dass im "lexikostatistischen Prüfwortschatz" diese Ersetzungen graduell geringer ausfallen, ändert nichts an der Unberechenbarkeit ihrer sozio-historischen Ursachen; selbst in Swadeshs gut erforschter englischer 100-Wörter-Testliste wurden z.B. mindestens 6 % Entlehnungen aus nordischen Wikingerdialekten von manchen "Experten" nicht bemerkt (vgl. u.a. Holm 2007c). Man kann Journalisten nicht vorwerfen, dass ihnen diese Zusammenhänge zunächst verborgen bleiben. Doch von Wissenschaftlern sollte erwartet werden können, dass sie sich um Hintergründe und Kausalitäten bemühen, statt diese mechanistischen Vergleiche blind zu übernehmen.
--------

5. Publikationen: (Weiteres siehe auch Google Scholar, Academia.edu, und Researchgate.Net)
orcid.org/0000-0001-9527-0553

- Holm, Hans J. (2024): Die ältesten Räder der Welt – von den Indogermanen erfunden oder nur bei ihrer Ausbreitung
benutzt? Neueste archäologische und sprachwissenschaftliche Ergebnisse. Inspiration Unlimited 2024.
ISBN 978-3-945127-54-4. Mit 406 Referenzen, 11 Graustufen- und Farbabbildungen im Text sowie Miniaturabbildungen aller
130 repräsentativen Radfunde, darunter neue Funde in Deutschland und Westchina. - Haben die Ur-Indogermanen das Rad erfunden?
[Zusammenfassung: Der Autor fasst mit diesem Buch seine jahrzehntelangen interdisziplinären Untersuchungen zur
Genese und Ausbreitung der Indogermanen zusammen. Für die Abschätzung der Entstehungsperiode und -region sind
die Radfunde von zentraler Bedeutung, weil die Tochtersprachen des Ur-Indogermanischen mehrere gemeinsame
Begriffe für das Fuhrwesen besitzen. Weil diese - für die Ursprache linguistisch rekonstruierte - Fuhrwerksterminologie
die Existenz der zugehörigen Technologie voraussetzt und deren Aufkommen wiederum archäologisch inzwischen
räumlich und zeitlich gut nachvollziehbar ist, muss in diesen Räumen zu diesen Zeiten auch die Ursprache
bereits existiert haben.
Untermauert wird die erreichte Abschätzung durch modernste glottochronologische Berechnungen (Hochrechnung des
Wandels von Bezeichnungen in der Zeit) mit Hilfe der seit einigen Jahren vermehrt genutzten Bayes’schen
Wahrscheinlichkeitsmethodik.
Abgesichert und abgerundet wird das Bild durch neueste Befunde der Populationsgenetik. Dies schließt auch die
genetischen Untersuchungen der genutzten Pferde ein, die mit den Indogermanen in Verbindung gebracht werden.
Nicht zuletzt werden auch mögliche Einflüsse der damals herrschenden Umweltbedingungen auf die Ausbreitung der
frühen Indogermanen untersucht.
Abschließend ergibt sich auch, dass funktionstüchtige Räder nicht zu einem bestimmten Zeitpunkt "erfunden"
worden sind, sondern dass es sich dabei um eine sich über Jahrhunderte hinziehende Entwicklung gehandelt hat.]
- Holm, Hans J.J.G. (2022): Meine "Holms universale lexicostatistische Testliste" ist eine modifizierte Version
der letzten Ausgabe von M. Swadesh (1971 posthum). Ihre sogenannten "unmarkierten" Übersetzungen in
17 repräsentativen ausgestorbenen und lebenden indogermanischen Sprachen ergeben 870 verschiedene Wortstämme.
Basiert auf etwa 160 Referenzen. Die Arbeit kann auf Anfrage an meine unten angegebene e-mail zugesandt werden. - Entwickelt für lexikostatistische Arbeiten zu den 12 indogermanischen Hauptzweigen!

- Hans J.J.G. Holms laufende Kartennotizen der (Vor-)geschichte - von der Biskaja bis zum Kaspischen Meer
- von der Eiszeit bis zum Mittelalter; in 27 Zeitscheiben, jeweils mit laufender Klimaleiste (auf Basis Holm 2011a)
und laufender Kulturenleiste. Meist Deutsch, oft Quellsprache. Blättern Sie durch >Holms historische Zeitscheiben. - Eine aktuelle Version kann auf Anforderung zugesandt werden

- Holm, Hans J. J. G. (2019): The Earliest Wheel Finds, their Archeology and Indo-European Terminology
in Time and Space, and Early Migrations around the Caucasus. Mit 306 Quellennachweisen, 6 überwiegend
farbigen Abbildungen im Text, sowie verkleinerten Abbildungen von 130 repräsentativen Radfunden (dabei aktuelle - Erfanden die Indogermanen das Rad?
aus Deutschland und China). Series Minor 43. Budapest: ARCHAEOLINGUA ALAPÍTVÁNY. ISBN 978-963-9911-30-5.
Bitte finden Sie die Verfügbarkeit in Google!
[Zusammenfassung : Die Rolle, die das Wagenrad im Leben der Indogermanen spielte,
wurde bisher vor allem aus der Sicht von Spezialisten untersucht, oft ohne ausreichende
Berücksichtigung betroffener Nachbardisziplinen. Wir recherchierten nun die ältesten Radfunde
(vor ca. 2000 v.Chr.) und stellen eine repräsentative Auswahl von 130 Funden zwischen der Nordsee,
Zentralasien und Indien sowohl tabellarisch als auch geographisch vor.
Anschließend haben wir die fünf Radbezeichnungen der indogermanischen Hauptfamilien heraus-
gearbeitet, insbesondere im Hinblick auf onomasiologische Aspekte. Um beide Ergebnisse mit der
Entwicklung der indogermanischen Sprachen in Beziehung setzen zu können, greifen wir auf ein
aktuelles glottochronologisches Gerüst zurück. Dies führt bereits zu Erkenntnissen über das Alter
einiger Bezeichnungen sowie zu deutlichen Parallelen mit bestimmten Konstruktionsarten.
Darüber hinaus werden vor diesem aktualisierten Hintergrund zwei häufig diskutierte Fragen
behandelt. Zum einen gibt es bezüglich der Trennung der (indogermanischen) Anatolier und Tocharer
viele Hinweise darauf, dass diese im Kaukasus vom östlichen Hauptast aus stattgefunden hat.
Des Weiteren werden die Hypothesen für die "Erfindung" des Rades durch den weitaus realistischeren
Vorschlag einer langanhaltenden Entwicklung in einem weiten Kommunikationsnetz ersetzt.]
Richtigstellung: Ich entschuldige mich für den Tippfehler in Fußnote 5, richtig ist "S(usanne) Kuprella".
- Holm, Hans J. (2017): Steppe Homeland of Indo-Europeans Favored by a Bayesian Approach
with Revised Data and Processing. Glottometrics 37, 54-81. Bochum: Ram-Verlag. Open access
http://www.ram-verlag.eu/journals-e-journals/glottometrics/ - Verschiedene Teste eines Bayes'schen Ansatzes mit eigener Swadeshliste, im Vergleich mit Radbezeichnungen und Archäologie.
[Zusammenfassung: Trotz Dutzender Hypothesen werden Ursprung und Ausbreitung der indo-
germanischen Sprachen weiterhin kontrovers diskutiert. Ein in Science (2012/2013) erschienener
glottochronologischer Ansatz unter Bayes'scher Methodik beanspruchte, die Gleichzeitigkeit mit
der neolithischen Expansion erbracht und damit die sogenannte „Anatolien-Hypothese“ bewiesen
zu haben. Die Ergebnisse stoßen jedoch auf Kritik seitens anderer Disziplinen.
Wir gehen hier den angeblichen Beweisen für die berechneten Zeiten durch Replikation der
veröffentlichten Methodik unter Einsatz eines eigenen, verbesserten Datensatzes auf den Grund.
Daraus ergab sich zunächst ein Ursprung bei etwa 4800 v.Chr., wobei allerdings die Struktur der
Stammbäume in mehreren hundert Tests erheblich variierte.
Diesem Problem begegneten vorhergehende Arbeiten durch scharfe topologische Vorgaben.
Weil Verben bekanntermaßen am wenigsten anfällig gegen Entlehnungen sind, entschied ich mich dazu,
einen Stammbaum aus dem besten dazu verfügbaren indogermanischen Datensatz mit über 1.100
Verbalwurzeln, der zunächst keine Chronologie beinhaltete, als "cladistic constraints" vorzuschlagen.
Dies ergab eine erste (West-Ost-)Aufspaltung bei einem Mittelwert von 4100 v.Chr.
Während dieser Teste erbrachte ein weiterer, in Language (2015) erschienener Ansatz Ursprungsdaten
zwischen 3950 – 4740 v.Chr. Dort wurde davon ausgegangen, dass frühere Ergebnisse durch schlecht
belegte Zwischenstufen verfälscht gewesen seien, die man versuchte, schrittweise zu korrigieren.
Der hier erhaltene Stammbaum spiegelt einige neue Erkenntnissen aus Linguistik, Archäologie und
Genforschung, die zugunsten der Steppenhypothese sprechen. Vor allem zeigt eine neue archäologisch-
linguistische Gegenüberstellung, dass verschiedene indogermanische Wagenradbezeichnungen mit
verschiedenen Konstruktionstypen in den entsprechenden Sprachräumen korrelieren. Zum Schluss
werden die auf den möglichen Ausbreitungswegen und -zeiten liegenden archäologischen "Kulturen"
als Overlay über den berechneten Stammbaum gelegt, ohne allerdings damit in jedem Fall deren
indogermanischen Charakter zu postulieren.]

- Holm, Hans J. (2011b): "Swadesh lists" of Albanian Revisited and Consequences for Its Position
in the Indo-European Languages. The Journal of Indo-European Studies 39-1&2. - Englische, leicht verbesserte Version (>Corrigenda (inaktiv))
[Abstract: In the last decade, several scholars pretended to have finally solved the subgrouping
of Indo-European by new lexicostatistical attempts. The public, of course, was not able to perceive
the questionable outcomes, of which the different and idiosyncratic positions of Albanian are in
particular conspicuous. One reason for this is the inadequate methods, simply copied from bioin-
formatics (cf. Holm, H. J. 2007b). That defective data contribute a lot to these mistakes,
is now here first demonstrated by analyzing the Albanian part of three representative lists
frequently employed in these studies: The presumably thirteen percent mistakes there mix
inextricably with the overlooked stochastic dispersion. Seventeen new etymologies are proposed,
however, thirty percent of the list remain unsolved or questionably. Moreover, the high amount
of recent replacements in Albanian is one more compelling argument against the rate assumption
in glottochronology.] (Deutsche Zusammenfassung siehe 2009)
- Holm, Hans J. (2011a): Archäoklimatologie des Holozäns: Ein durchgreifender Vergleich
der "Wuchshomogenität" mit der Sonnenaktivität und anderen Klimaanzeigern ("Proxies"). - Klimaänderungen im Mittel- und Spät-Holozän in Eiskernen Grönlands und alpinen
Archäologisches Korrespondenzblatt 41-1:119-132. Baumgrenzen - (Hintergrundwissen für mögliche Ursachen von Migrationen)
Das PDF finden Sie hier: >Holms Archäoklimatologie.
[Schmidt/Gruhle stellen mit ihrer sogenannten "Wuchshomogenität" - hier: mitteleuropäischer
Eichenstandorte - einen guten Indikator für feucht-warme gegenüber trocken-kalten Jahren vor.
Dies erweist sich zumindest für den nordatlantischen Bereich durch die relativ gute Korrelation
sowohl mit den Schwankungen der Baumgrenzen in den Alpen als auch mit den aus grönländischen
Eiskernbohrungen ablesbaren Temperaturverläufen.
Dagegen erweist sich die behauptete gute Korrelation mit der Sonneneinstrahlung (Insolation)
als Ergebnis zu kurzfristiger Betrachtungen oder sogar fehlerhafter Interpretation der Sonnenaktivität.]
- Holm, Hans J. (2010): Rezension zu Frank Sirocko (Hg.), "Wetter, Klima, Menschheitsentwicklung,
Von der Eiszeit bis ins 21. Jahrhundert". Hier: >Falsche historische Klimabeziehungen.

- Holm, Hans J. (2009): Albanische Basiswortlisten und die Stellung des Albanischen in den indo-
germanischen Sprachen. Zeitschrift für Balkanologie Nr. 45-2. Wiesbaden, Harrassowitz: 171-205. - Kritische Analyse einiger in lexikostatistischen Arbeiten benutzter Wortlisten -
Verfügbar über >online
(Anmerkung: Heute würde ich den irreführenden Ausdruck "Basiswortliste" durch "Universale Testbegriffsliste" ersetzen)
[Zusammenfassung: In der vergangenen Dekade hat eine Reihe von Wissenschaftlern den Anspruch
erhoben, mittels neuer lexikostatistischer Verfahren die Untergliederung der indogermanischen
Sprachen gelöst zu haben. Von der Öffentlichkeit konnte indes nicht erwartet werden, die
Fragwürdigkeit dieser Ergebnisse zu erkennen, wobei die unterschiedlichen und z.T. idio-
synkratischen Einordnungen des Albanischen besonders auffallen. Einer der Gründe hierfür
liegt sicher in der Unangemessenheit der oft aus der Bioinformatik übernommenen Methodik
(vgl. Holm, H. J. 2007, The new Arboretum of Indo-European ‘Trees’, in: Journal of Quantitative
Linguistics, 14-2). Dass zusätzlich in erheblichem Maße Datenfehler vorliegen, wird hier anhand
des albanischen Teils von drei häufig zu diesen Studien herangezogenen Listen nachgewiesen:
Im Ergebnis bilden die etwa dreizehn Prozent Fehler eine Mischung mit der vernachlässigten
stochastischen Streuung. Es werden siebzehn neue Etymologien vorgeschlagen, doch bleiben immer
noch etwa dreißig Prozent des albanischen Grundwortschatzes von unklarer Herkunft. Dies und der
stark wechselnde Einfluss von Entlehnungen bilden letztlich ein weiteres Argument gegen die
glottochronologische Grundannahme fester Ersetzungsraten.]
- Holm, Hans J. (2008): The Distribution of Data in Word Lists and its Impact on the Subgrouping
of Languages. In: C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (Editors): Data Analysis, - Lösung verteilungsbedingter Probleme plus verb-basierte
Machine Learning, and Applications. Proceedings of the 31th Annual Conference of the Gesellschaft = entlehnungsminimierte Datenbasis
für Klassifikation e.V., Albert-Ludwigs-Universität Freiburg, März 7-9, 2007. Springer-Verlag, -> verbesserter idg. "Stammbaum" -
Heidelberg-Berlin: 629-636. ISBN 978-3-540-78239-1.
Das Manuskript finden Sie hier >Holm SLRD Freiburg.pdf.
[Zusammenfassung: Linguisten pflegten anzunehmen, dass Sprachen desto näher verwandt
sind, je mehr Merkmale, insbesondere gemeinsame Neuerungen, sie teilen. In Holm (2003)
wurde gezeigt, dass diese Annahme schnell in die Irre führen kann, weil übersehen wird,
dass stochastisch die Menge gemeinsamer Übereinstimmungen von drei weiteren Parametern
abhängt. Mittels des 'maximum likelihood Schätzers' der 'Hypergeometrischen Verteilung'
konnten wir die Anzahl derjenigen Merkmale berechnen, die im Zeitraum der Trennung zweier
Sprachen diesen noch gemeinsam eigen war. Damit konnte eine Ausgliederungsreihenfolge
innerhalb solcher Sprachfamilien gewonnen werden, für welche die erforderlichen Daten
verfügbar waren. Mittels der Daten des Indogermanischen Etymologischen Wörterbuchs
(IEW, Pokorny 1959) waren die sich ergebenden späten Ausgliederungen des Hethitischen,
Albanischen und Armenischen zwanglos mit deren zentraler geographischen Lage erklärbar
und daher unverdächtig.
Erst, als in einer weiteren Anwendung mit Daten der Mixe-Zoque-Familie beobachtet
wurde, dass die am schlechtesten belegten Sprachen stets spät auszugliedern schienen,
konnte ein systematischer Fehler vermutet werden. Hier wird die Ursache dieses Fehlers
aufgedeckt, der nur bei Merkmalslisten natürlicher Sprachen auftritt, im Gegensatz zu
den in Holm (2007a) benutzten Testlisten mit stochastisch normalverteilten Daten. Zudem
stand für diese Untersuchung nun als erheblich zuverlässigere Datenquelle das "Lexikon
der indogermanischen Verben" (Rix et al. 2001) zur Verfügung. Vor allem wird hier erstmalig
die bei allen anderen Datenbanken immanente Verfälschung aufgrund von Entlehnungen
durch die ausschließliche Verwendung von Verben minimiert, die bei Weitem weniger entlehnt
werden als andere Wortarten.
In der Tat bewahrheitete sich der Verdacht, und es wird gezeigt, wie aus solchen quasi-
Pareto-verteilten Daten trotzdem die korrekte Ausgliederungsreihenfolge gewonnen werden
kann. Es ergibt sich eine (teilweise) neue Ausgliederungsreihenfolge der indogermanischen
Hauptzweige, die gut zu den grammatischen Tatsachen als auch der geographischen Verteilung
passt. Vor allem ergibt sich klar, dass sich die anatolischen Sprachen keinesfalls als erste
getrennt haben können und widerlegt damit eindeutig die "indo-hethitische Hypothese".]
- Holm, Hans J. (2007d): Ausgliederungsreihenfolge der Indogermania auf Grundlage des LIV2. - Zielgruppe: Deutsche Linguisten
Vortrag beim Institut für vergleichende Indogermanistische Sprachwissenschaft der Universität Bonn.
Hier gibt's den Dia-Vortrag als pdf: >Holm Idg. Ausgliederung Bonn.

- Holm, Hans J. (2007c): The Distribution of Data in Word Lists and its Impact on the
Subgrouping of Languages. Vortrag für die Gesellschaft f. Klassifikation, Univ. Freiburg - Zielgruppe: "Quantitative Linguisten", Statistiker
v. 7.-9. März 2007. Die Vortrags-Dias als pdf: >Holm Wortverteilungen und ihre Folgen, Freiburg.

- Holm, Hans J. (2007b): The new Arboretum of Indo-European "Trees" - Can new Algorithms
Reveal the Phylogeny and even Prehistory of IE? In: Journal of Quantitative Linguistics
14-2, S. 167-214. -> in D verfügbar in vielen Uni-Bibliotheken. Original-Kopien über
http://cats.tfinforma.com/PTS/in?t=rl&m=237780. Den Entwurf finden Sie hier >Arboretum IE trees. - Aktualisierung auf 2006, neuere lexikostatistische Ansätze
[Zusammenfassung: Die Spezialisierungen auf den Gebieten der Linguistik einerseits
und der Bioinformatik andrerseits führen zunehmend zu Missverständnissen und falschen
Ergebnissen, bedingt durch unzureichende Kenntnis der Bedingungen der jeweils ange-
wandten Methoden und Materialien. Diese werden analysiert und die Ergebnisse zur
Beurteilung der augenblicklichen Schwemme von Versuchen zur Konstruktion neuer
Stammbäume der indogermanischen Sprachen herangezogen.]
- Holm, Hans J. (2007a): Language Subgrouping. In: Grzybek, P. & R. Köhler (Editors),
Exact Methods in the Study of Language and Text. Dedicated to Professor Gabriel Altmann
on the occasion of his 75th birthday. [Quantitative Linguistics 62].
Berlin: De Gruyter: 225-235. - Umgang mit stat. Streuungen in mehrstufigen Untergliederungen
[Zusammenfassung: Nach mehreren Jahren der Erprobung, und angesichts vieler
konkurrierender Verfahren, wird die Trennmengenberechnungsmethode (Holm 2000,
passim) im Hinblick auf ihre Erfordernisse verfeinert. Es wird getestet, wie stochastische
Streuung von schlechten Daten unterschieden werden kann und welche Anforderungen
Daten erfüllten sollten.]
- Holm, Hans J. (2005): Genealogische Verwandtschaft. Kapitel 45 in Köhler, R., Altmann, G.
& Piotrowski, R. 'QUANTITATIVE LINGUISTIK' - Ein internationales Handbuch [HSK-Serie, Bd. 27],
Berlin; New York: De Gruyter Mouton. doi.org/10.1515/9783110155785 - Forschungsgeschichte der lexikostatistischen Ansätze zur Gliederung von Sprachen im 20.Jh. Aktualisierung s.o. 2008 -
[Inhalt: 1. Wann sind Sprachen "verwandt"? 2. Datenbewertung; 3. Beziehungsmaße;
3.1. Synchrone ~; 3.2. Diachrone Beziehungsmaße; 4. Strukturierung genealogischer Abhängigkeiten.]
- Holm, Hans J. (2003): The proportionality trap, Or: what is wrong with
lexicostatistical subgouping? In: Indogermanische Forschungen 108: 39-47. - Grundlagen auf Englisch; auch für Nicht-Mathematiker geeignet -
[Zusammenfassung: Es wird anhand eines Experiments gezeigt, dass die rohe Anzahl
von Übereinstimmungen (z.B. der Kognaten) zwischen zwei verwandten Sprachen
prinzipiell nicht den Grad der genealogischen Verwandtschaft wiedergeben kann.
Anschließend wird demonstriert, wie durch Berücksichtigung aller statistisch
bestimmenden Parameter die unterschiedliche Ausgangsbasis der Paarungen und
damit die korrekte Ausgliederungsreihenfolge wieder hergestellt werden kann.]
- Holm, Hans J. & Embleton, Sheila (2001): Review of 'Mathematical Foundations of
Linguistics' (by Hubey, H.Mark, 1999, LINCOM handbooks in Linguistics 10,
München: LINCOM); In: Journal of Quantitative Linguistics 8-2:149-62.

- Holm, Hans J. (2000): Genealogy of the Main Indo-European Branches Applying the
Separation Base Method. In: Journal of Quantitative Linguistics 7-2:73-95.
Einige Abbildungen fand ich noch in >Holm Sep Base Meth Abbildungen -Anwendung auf Pokornys Indogermanisches Etymologisches Wörterbuch; Aktualisierungen s.u. 2007a,b -
[Zusammenfassung: In bisherigen quantitativen Analysen der genealogischen Beziehungen
zwischen Sprachen wurde der durch Ersetzungen bedingte systematische Fehler nicht
angemessen eliminiert, was nur zu falschen Ergebnissen führen konnte. Erst dank
der Auszählung der riesigen und damit statistisch erst signifikanten Datenmenge
aus J. Pokorny „Indogermanisches Etymologisches Wörterbuch“ (Bern: Francke,
1959), in: N. Birds „Distribution of Indo-European root morphemes“ (Wiesbaden:
Harrassowitz, 1982) war es trotz einiger bekannter Mängel möglich, die Anzahl der
Lexeme im Zeitraum der Trennung jedes Sprachenpaares mit Hilfe eines robusten
Schätzers zu berechnen und damit die Ausgliederungsreihenfolge zu erschließen.
Die üblichen Schwarz-Weiß-Hypothesen, z.B. pro oder kontra eine italo-keltische
Verwandtschaft, können den realen Entwicklungen nicht gerecht werden und sollten
diesen differenzierteren Ergebnissen Platz machen.]

------------

Started 2010-05-27:

Eine mögliche Urheimat der indogermanischen Sprechergemeinschaft

und ihre Wanderwege nach der erweiterten Trennmengenmethode (Separation Level Recovery under Two Distributions, SLR2D)

Von Hans J. J. G. Holm