多數讀者最常用的中文(漢語)屬於漢藏語系,除了中文以外,漢藏語系還有超過 400 種語言,是東亞最多人使用的語系。有關它的起源,有 2 個主要假說。
Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic
假說一,漢藏語系的源頭距今 6000 年左右,位於新石器時代的華北。大概在 4000 到 6000 年前,漢藏語系分成兩大分支,一群向西南前進,後來抵達現在中國的西南部和東南亞一帶,另一群則是在東亞,由北向南前進。
假說二,漢藏語系能追溯到超過 9000 年前,現在中國的西南、東南亞一帶,此一區域是如今漢藏語系多樣性最高的地方。隨後再由東亞的西南方,傳到東亞其他地區。
這個 2019 年的論文由中國學者主導,自 STEDT 語言資料庫蒐集 109 種漢藏語言,用貝氏法(Bayesian)建構語言間的親戚關係,希望找到漢藏語系的起源。
(語言學研究,但是計劃主持人是復旦大學的遺傳學家金力 XD 語言DNA一家親?)
STEDT 語言資料庫:
Sino-Tibetan Etymological Dictionary and Thesaurus
畫語言關係樹的時候,沒有給予不屬於漢藏語系的外群,也沒有預設既定的大分群,只是直接比較 109 種語言的關係。得到的結果是,漢語 Mandarin,是所有語言中最早與其他人分家的。也就是圖中最下面紅色那支。
用演化研究英文文法:動詞過去式、助動詞do、否定句的改變原因
其他語言,則是能歸類為另一大群。它們和漢語的共同祖先,也就是原始漢藏語的年代,能追溯到距今 5871 年前,介於 4183 到 7817 年前之間。論文指出,這就是漢藏語系的起源時刻。
另一大群儘管相比於漢語之下,數目非常非常多,卻能歸類為同一群,它們的共同祖先則是能追溯到距今 4665 年前,介於 3716 到 5688 年前之間。
如果這個語言關係樹是對的,原始漢藏語的年代,真的處於 5871 年前左右,那麼源自華北的假說一比較合理。漢藏語發源於黃河中下游的新石器時代晚期,隨後向南與西南傳播。主要仰賴小米的華北農夫,帶著農業與語言,離開家鄉向其他地方遷徙,也把農業和語言傳播出去......
考古上,最有關係的,或許是距今 5000 到 7000 年前,華北的仰韶文化,以及地理更西方一些,距今 4000 到 5500 年前的馬家窯文化。而距今 3500 到 4300 年前的齊家文化,在漢語和近親分家以後,也許也是重要的一站。
題外話,論文估計漢藏語系誕生的時期,和另外兩大語系:印歐語系、南島語系,起源的年代非常接近。該不會有什麼大語系時代?
憑什麼小小臺灣是世界四億南島語族的發源地!只是這「南島語族」可能跟你想像的不一樣……
這個論文有什麼潛在問題?我對這個議題不熟, 提出幾點。
看看這棵樹,它和南島語系的樹形相似,都是相對少量的語言,分家年代比較古早,而其他絕大部分語言,儘管數目非常多,卻能歸類為同一個分支,在相對較晚的年代大量衍生。可是,南島語系的古早分支,台灣的福爾摩沙語們,有好幾種分開許久,能明確分出差異的語言,在樹形中的相對位置很明確。
相比之下,漢藏語系的漢語卻只有自己一種。如果有很多種語言,要估計共同祖先的年代,應該比較可靠(不單純是統計的技術問題,是還有多少未知的問題),因此,漢藏語系旗下,漢語以外的語言共同祖先約為 4665 年前,應該比較能夠確定。
但是,在一個分支,只有自己一種語言的狀況下,還要和另一個大群(視為另一個分支)一起比較,估計兩者的共同祖先,恐怕疑慮就比較大。漢藏語系中的漢語和其他語言,地理分佈非常非常不平均。
歷史上,漢語當然不可能只有一種,只有一種,是現在只剩下一種,其他曾經存在過,能和漢語歸類為同一群的近親都消失惹。假如把它們也納入分析,結果會不會有變化呢?光憑現有資訊,無法回答這些問題,不過要更完整地認識漢藏語系,值得放在心裡。
差不多同時的另一個研究:
漢藏語系源自7200年前的華北,移民帶著馴化生物上路,又沿路收編?
論文短評:
The origin and spread of the Sino-Tibetan language family
歡迎光臨粉絲團一起討論: 盲眼的尼安德塔石器匠
留言列表