全网最佳IP代理服务商- 9.9元开通-稳定的代理服务
如果您从事外贸、海外视频博主、海外推广、海外广告投放,欢迎选择我们。
让您轻易使用国外主流的聊天软件、视频网站以及社交网络等等

苹果申请美国id

语系是如何命名的?我相信这件事属于非常基本的问题,但同时也基本到很少有人会全方位系统性地总结,所以本文就来一次大盘点。

说重要吧,它好像又没那么重要,因为相比于起什么名字,在历史语学内根据哪些特征能判断出一种语系的谱系、并基于此构拟出原始祖语,才是历史语学家更关心的事,名字不是特别值得纠结。——但要是说它不重要吧,无论是对于一般的圈外人士,还是圈内但研究范围不涉及某一语系的人,“语系名称”就是对于一系列语言的最直观认识,如果理解不恰当就会造成很多的误会。也因此,这就是我想要专门写一篇文章的原因,希望通过区分常见的5种命名方式来减少误会,并同时说明一些可能存在的误会,最后再集中汇总4个相对重要的问题(当然只能提议,能不能改不是我一个人能决定的……)。

另外,本文的核心内容是「命名」问题,对象通常是规模相对较大的语系,分类依据为 Glottolog,会简单带过语系的基本信息,但重点不会放在语系内部的谱系介绍及其争议上。

取语系分布两端的地理名称,或是语系分布范围边缘的两种语言/语族的名字,在语系名称里通常会见到连字符。

印欧语系作为没有之一的最著名、研究最完善的语系,在各种历史语学介绍里几乎百分之百会被提及。但是,为印欧语系正名,是我想要写这篇文章的一个非常重要的原因——叫“印欧”是因为这个语系在地理跨度上西起欧洲、东至印度阿萨姆邦(或把马尔代夫看作印度文化圈的一部分,说北起欧洲、南至印度也行),而不是因为印欧语系在谱系上可以分成“欧洲”和“印度-伊朗”两支!所以,下面这幅广为流传的“树”不能解释成谱系分类:

如果要严格从谱系上来讲,则需要按下面这张图——最早分离出的是安纳托利亚语族,其次是吐火罗语族,而至于上图中似乎一开始就分家跑到中亚南亚去的印度-伊朗语族,则处在一个相对靠内的位置,在它分离之前还有阿尔巴尼亚语族-希腊语族-亚美尼亚语族的共同祖先已经分离了。

原本叫 Afro-asiatic,现在更提倡叫 Afroasiatic,差别就在于把中间的连字符去掉了,汉译叫“亚非语系”即可(不叫“非亚语系”是避免连仄),也不用考究式地译作“阿非罗-亚细亚”。去掉连字符是为了避免把“亚”和“非”对立起来,因为亚非语系主体分布在非洲,六个语族里只有存在感最强的闪语族的一部分跑到了亚洲(后来又随阿拉伯征服回到了北非)。所以,当把“亚”和“非”对立起来时就显得比较不平衡。

P.S. 请不要用“闪含”,除闪语族以外的五个语族无法构成“含语族”(之后也将会见到一些例子,在语系内去除一小部分后,其它成员缺乏合适的统称)。

我在这篇文章里已经提过,这个横跨澳洲7/8面积的庞大语系取了东北角的帕马语和西南角的牛雅语来命名,可以说是最经典、丝毫不漏的根据地理分布命名的案例。

有182种语言,是全美洲最大的语系,以极其复杂的声调系统著称,目前全部分布在墨西哥境内,曾经位于尼加拉瓜等国的语言已灭绝。取了西北的欧托-帕梅语族和东南的曼格亚语族(已灭绝)来命名。

有69种语言,是北美洲第2大语系。向北广泛分布在美国的大平原上,最北端抵达犹他州;最南端则来到墨西哥中部,是曾出现过阿兹特克帝国的纳瓦语族。

这一条需要和下面将出现的第四类“取代表”作区分。这里指的是一个语系内各语种使用者通常彼此之间没有建立认同感(也就是在生产力水平较低的地区,彼此往来不多),而语言学家选取该语系分布范围内的一个整体地理名称来命名。由于小语系是常态,大语系才反常(意识不到是因为只有大语系才有存在感),所以像是「某语系的几种语言沿着某河流/山脉分布,所以用该河流/山脉的名称来命名该语系」是很普遍的。

由于巴布亚诸语里每个语系相对较小,分布非常零散,所以往往用一条河流或一座山脉的名字就够了。包括最大的跨新几内亚语系(图中大片的蓝绿色区域),也是把“新几内亚岛”的名字直接赋予了这个横跨新几内亚高地并蔓延到部分低地上的庞大语系。而我一直想吐槽的最随意的命名莫过于……“边境语系”,就是因为印尼和巴新的边境穿过该语系而得名。

南亚语系在相对较早的年代就顺着澜沧江-湄公河扩张,之后由于南岛语系的、更强势的汉藏和仡台语系的南扩、印欧语系的东扩,导致其除了在越南、柬埔寨和老挝有较集中的分布以外,在(地缘政治上的)东南亚、南亚各国都只能找到一些零星的语族残留,呈现出一种貌似“哪儿都有”的特点。——所以,如果要总结一个共性,似乎也只能说是“分布在亚洲南部的一些语言的总和”。

“苏丹”很容易歧义,不仅是因为汉语音译时把指“王”的 sulṭān(阿拉伯语词根√slṭ“有力量”)和指“国家/地区”的 sūdān(词根√swd“黑”)弄混了(见这里),后者还存在是指“苏丹共和国”还是“苏丹稀树草原”的歧义。有两片语言的命名建立在“苏丹稀树草原”(下图)之上——中苏丹语系和东苏丹诸语(但后者争议较大,其中有一部分可称为“尼罗语系”)。

对,既然看到“尼罗”了,了解非洲语系分布的朋友应该就能想到“尼罗-撒哈拉语系”,是格林伯格当年提出的“非洲五大语系”之一,但因为时常被诟病为“除了其它四者以外所有语言的分类垃圾桶”,争议很大,所以这里不用“尼罗-撒哈拉语系”,统称改为“尼罗-撒哈拉诸语”,具体再分解成不同的目前相对较认可的语系单位。

注意,我用下面这张图只是因为它大概展示了“尼罗-撒哈拉诸语”的地理分布,不代表它的谱系分类就正确。这里把东苏丹诸语拆成了 A, B 两片,B 片就是尼罗语系,而 A 片在 Glottolog 上不承认作为整体(拆成了 Nubian, Surmic, Dajuic, East Jebel, Tamaic, Nyimang, Temeinic 七个语系和 Nara 一种孤立语)。

P.S. 尼罗河虽然日常被埃及宣扬为自己的母亲河,但它也是流域内其它十个国家的母亲河。“尼罗语系”或许更贴切的叫法是“白尼罗语系”,涉及的语言多数分布在从维多利亚湖流出的白尼罗河流域,另有少部分在维多利亚湖东南的肯尼亚和坦桑尼亚境内。

既然讲到“尼罗-撒哈拉”,那么撒哈拉语系也得提一下。不过叫“撒哈拉”可能比较尴尬,因为这只是个有10种语言的中型语系,而整个撒哈拉沙漠这么庞大,必然意味着“不是所有撒哈拉沙漠里的语言都是撒哈拉语系的”(比如亚非语系的柏柏尔语族也是典型的撒哈拉沙漠内的语言)。

P.S. 事实上如果要考虑“柏柏尔”的命名问题,则应列入第三类第二小点下的“不恰当”(到时候具体还会说明),它和“爱斯基摩”类似,都属于是语言使用者不喜欢的称呼,但因为要指代整个语族层面时缺乏合适的统称,所以姑且就这么叫了。

用超过两个地理名称来命名一个语系的情况较少见,因为这样看起来比较冗长。比较典型的例子是帝汶-阿洛-潘塔尔语系,属于“巴布亚诸语”之一,命名来自努沙登加拉群岛里的帝汶岛、阿洛岛和潘塔尔岛三个岛。不过,如果根据谱系严格来说,是“帝汶-(阿洛-潘塔尔)”,后两者构成一个语族(下图中红色)。

这一类例子非常罕见,因为全球语系的普遍了解情况就是……了解很少,因此「先根据共时层面的地理位置来起个名字」才是最合理的做法;至于要试图探讨语系的发源地,基本是不太现实的。

这一类里大概唯一的例子就是乌拉尔语系,基于假定的发源地乌拉尔山脉。不过这就导致它的名字和实际给人的印象有点错位,除了汉特语族(下图蓝圈)和曼西语族(紫圈)基本停留在乌拉尔山脉周边以外,有六个语族经历了西扩的过程,甚至全语系人口60%的匈牙利语跑到了整个语系最西边的位置(而东扩的只有萨莫耶德语族)。总之,在说起“乌拉尔语系”时,最有名的似乎只有匈牙利语、芬兰语和爱沙尼亚语三个(因为建立了独立的民族国家),甚至会产生“这个‘乌拉尔’和乌拉尔山脉真的有关系吗”的困惑。

对于尤其是「语言数量偏少、谱系分类相对简单」的语系而言,有时不需要基于所在地的名称,而是直接根据谱系上靠外层(或者说“更高层”)的语种来命名即可。

这就是迷你语系的普遍情况,如果只知道有2种(偶尔是3种)语言互相有联系,那定语系名称时就简单把两者拼起来即可。在 Glottolog 上所有只有2个语种的语系中,有23个就基于这两者名字的简单拼接:

最典型的例子就是日琉语系(虽然不同语言里的名称有差异,有不少是直接叫“日本语系”的),如果不考虑谱系有争议的八丈语,那么日语就作为一种最高层的单列语言,其它语种再根据地理分布构成“琉球语族”。

分布在北美最北部的语系,少部分跨越白令海峡来到俄罗斯最东端。位于阿留申群岛上的阿留申语是语系中最靠外的一种语言,其余的因纽特和由皮克两支存在一个尽管并不恰当的统称——“爱斯基摩”(传统上认为指“吃生肉的人”,较新的观点认为是“给雪鞋穿鞋带的人”),总体上构成“爱斯基摩-阿留申”。

相比于上面一种,这一类里不存在「一种」最外层的语言,而是有两个语族共同位于整个语系的最高层。

位于俄罗斯最东部的楚科奇和堪察加半岛。这是理论上最符合条件的语系,因为楚科奇语族有4种语言,堪察加语族有3种,两者体量很接近。不过,事实上因为堪察加语族的灭亡速度很快,现在只有西部伊滕门语一种语言,且使用人口也很少。

零星分布在我国南方各省,少部分位于老挝和越南境内。由苗语族和瑶语族构成,但后者体量明显小于前者。

不过“瑶语族”的名字可能比较尴尬,因为不是所有瑶族人说的语言都是瑶语族的,几个比较大的语言包括勉语、布努语、拉珈语,勉语才是瑶语族的(或者也叫勉语族),而布努语属于苗语族,拉珈语则是仡台语系的,和苗瑶语系无关。

再提一下满-通古斯语系,因为传统上认为它是由满语族和通古斯语族构成,但较新的观点将“通古斯语族”中再拆出一类“过渡语族”,包括乌德盖语、赫哲语/那乃语等。——因此,尽管满通语系在命名上似乎是根据谱系的二分法,但已经不符合事实上的情况。

(根据评论区建议,Glottolog 上的“满-女真”语族里“女真”可能不恰当,或许直接要基于地理直接分成北部、过渡、南部语族)

上面两大类的情况都是各语种使用者较为分散,没有形成统一的认同感。而有些语系使用者之间的联系就很强(或者说当初“看起来很接近”),也存在一个统称。

受土耳其的推动,突厥语各民族间的联系在愈发加强,是这一类里最著名的例子。但因为涉及一些分裂问题,“突厥”一称可能带有一定的负面色彩,所以圈内人士也建议改译作“图尔克”。

突厥语系广泛分布于西亚、中亚、北亚等地,大概可以用这张图来表示其地理分布:

但如果要从谱系上来看,全语系层面不应该是上图那么色彩缤纷的情况,而是只能标注为两种颜色——一种是占绝大部分的“共同突厥语”;另外则是乌古尔语族(Glottolog 里称为“保加尔语族”),目前仅剩一种楚瓦什语。所以,突厥语系本质上也是上面提到的「有极少数语言位于最外层」的情况,只是没那么命名。

使用范围覆盖了安第斯山脉的多数地区,继承自原印加帝国(自称“塔万廷苏由”)的疆域,目前被秘鲁、厄瓜多尔和玻利维亚定为官方语言。其实在这一类里,最典型的就是克丘亚语系,突厥语系不过是最著名而已——“克丘亚语系”是基于语学上的定义,考虑到语言本身的互通度与差异性;但如果就语言认同感来说,可以认为它就是一种语言(即一种孤立语,尽管和艾马拉语系可能有联系),整个语系内所有的语言其实都叫作“XX克丘亚语”,和汉语、阿拉伯语的情况类似,属于宏语言。

通常认为“达罗毗荼”原本指的是“泰米尔”(可能经历了 *tamiṟ *damiḷ damiḷa draviḍa),后来用于指印度次大陆(及周边一带)相较于雅利安人(即印欧人)而言的原住民。作为有2.5亿使用人口的庞大语系,有4种语言的人口上千万(泰卢固、泰米尔、卡纳达、马拉雅拉姆),但其存在感却异常低;同时,“达罗毗荼人”的整体认同感也相对较弱,介于“能接受”和“不恰当”之间。

位于北美五大湖和圣劳伦斯河沿岸,名称来自于早在殖民者到来前就成立的所谓“易洛魁联盟”,但这个称呼源自其敌对的某种阿尔冈昆人的称呼,而他们自称用的是“Hodínöhšö:ni:h”。就目前来看,零散分布的各易洛魁语之间也没有彼此的认同感,自称用的不过是部落名,甚至不知道有“易洛魁”这么一回事。

属于分类垃圾桶“尼罗-撒哈拉诸语”下的一员,分布和西非曾经的桑海帝国有关,命名亦来自于此。但需要注意的是,“桑海”是桑海帝国里上层阶级的称呼(来自开国君主桑尼·阿里的名字),现代狭义上的“桑海人”也仅仅指分布在尼日尔西部蒂拉贝里省的、桑海帝国旧时贵族的后代,而桑海语系里其它语言的使用者更能接受的称呼是“艾内哈”(Ayneha)。——然而,和下面将会出现的第四类“取代表”的不同点在于,“桑海”虽然也有点以偏概全的意味在,但它的来源不是语系内部的一种语言,所以只能说是不恰当或有争议的统称。

语种数居北美第3,主体部分为阿尔冈昆语族(Algonquian),广泛分布在北美东部到北部;而由罗克语(Yurok)和维亚特语(Wiyot,/wíjɑt/)则非常突兀地位于西海岸的加州,谱系上也不属于阿尔冈昆语族。Algic 这个名字最早由Henry Schoolcraft创造,用于指从阿勒格尼高原(Allegheny,美国东北部)到大西洋之间的民族,这些民族的语言后来自然被并入了阿尔冈昆语族中;但随着后来位于西海岸的两种语言被发现和阿尔冈昆有联系,“阿尔吉”这个名字又被拿了出来作为整体概念。——总之,只能说这是个便于称呼全体的方式,而且由于现在由罗克语和维亚特语已经灭绝,“阿尔吉”一称也在逐渐让位于“阿尔冈昆”。

属于北美(乃至中美南美)命名极其随便的一个典例……瓦卡什是北美西北海岸一个“没那么小的”语系,wakash 来自于该语系内纽察努司语(Nuučaan̓uł /nuːʧaːnˀuɬ/)的“好”一词。是的,仅仅来自其中一种语言的一个词。

这也算是北美(可能包括中美南美)语种乃至一些语系命名的缩影,很多民族的语言在语学上的称呼(甚至有时包括自称)都会用“说话”、“人”、“我们这”、“好”之类的含义(只是本文不涉及太小的语系,但这类现象真的很常见),这里纽察努司语倒是在正名后已不再使用原本的 Nootka,也没有变成所谓的“瓦卡什语”。

属于亚非语系下的一员。这里的命名情况比较复杂——“柏柏尔”一词最早是希腊人用来指蛮族的,后来只能说是因为语学层面缺乏对北非一块亚非语的统称,而采用了这样一个贬义词。在近年来日益兴盛的柏柏尔民族复兴中,因为主要在摩洛哥、且摩洛哥较强势的一支柏柏尔人为“阿玛齐格”(T-amazigh-t,t-…-t 是环缀,不叫“塔玛齐格特”),所以比如阿拉伯语里现在就改用了 al-ʔamāzīġīyah 指“柏柏尔语族”,但这就导致变成了一种以偏概全的称呼,“柏柏尔人”范畴下有很多民族和语言,其它民族未必就认可“阿玛齐格”一称。

P.S. 上面提到过的爱斯基摩语族也是类似的情况,只是民族复兴运动可能没那么强势。

看上去这一类似乎还是针对迷你语系而言的,只需要在那么仅有的几种语言里抽一种出来作代表即可。然而事实上,这一类不乏中型乃至大型语系;其中原因可能有很多,但因为我知识有限,以下姑且只挑几种我清楚的,其它的以后或许再补充……

注意,此时往往会对代表语言的名字后加后缀,在英语里最常见的就是 -(i)an 和 -ic 两种(具体取哪种可能比较任意)。当然,通常对于一种特定语言而言,是不建议在翻译时放入词缀的(比如班图语各类表语言的前缀我就一直提倡要去除,诸如Kiswahili、Lingála、Sesotho、Chichewa 等等),但这里是语系/语族/语支等等的名字和语种只存在后缀的区别(比如 Arawak 是语种,Arawakan是语系),那还是需要考虑把词缀放进去,以避免出现诸如 Proto-Arawakan 和 Proto-Arawak 都是“原始阿拉瓦克语”的误会。个人推荐的译法是:

苹果申请美国id

若语种名里没有 -(i)a,则语系名后加“-亚”或用读音带/-a/的字,如 Tupí“图皮语”vs. Tupí

若语种名里有 -(i)a(这一类情况较少见),那为了区分,只能把 -n 放进译名,如 Worrorra“沃罗拉语”vs. Worrorra

对于 -ic:在第四类语系命名里不常见,但其它几类的语系里偶尔会用(如 Turkic),同时在语系往下的语言层级里非常常见,音译时可以用读音带/-i/的字,或是用“XX类”(试图对标古生物学分类上因传统分类被打乱后采用的、较模糊的层级概念),如 Nyungar“牛雅语”vs. Nyung

但因为本文主要谈语系的命名,再往下的单位超出本文范畴,这里属于非常不成熟的建议。另外,在尤其是汉藏语系里会采用另一个 -ish 后缀,比如“藏缅语族”下套着 Bodic-Bodish-Tibetic-Tibetan,处理这种也是个问题。

另外也存在一个后缀 -oid,如来自 Bantu 的 Bantoid“类班图语”,这里“类-”是个前缀,和 -ic“-类”的位置不同,但有混淆的可能。

语系内存在一种相当著名的语言,用它来作为全语系的代表是毋庸置疑的,乃至于人们往往会误认为该语系内只有这种语言,难以意识到它并不是完全意义上的统称。

蒙语在全语系内的使用人口占据压倒性优势(80%以上),而且事实上和布里亚特语、卫拉特语的关系也非常近,而“鄂尔多斯语”等传统上只视作蒙语的一个方言;在民族认同上有差异的则是东北的达斡尔语、青海的几种(东裕固语、保安语、土族语、东乡语)和阿富汗的蒙戈尔语。所以,整体上来说更加偏向于上面的第三类。

尽管通常和阿兹特克与印加并列,但事实上“玛雅”在历史上的统一程度要低于另两者。“玛雅”一词在源头上仅仅指尤卡坦玛雅人(通常默认的“玛雅语”也就是尤卡坦玛雅语),严格来说不包括其它墨西哥南部、危地马拉、伯利兹等地的同语系人群(而且其实现代尤卡坦玛雅人的数量和另一支凯克奇人/Qʼeqchiʼ 差不多,并不占据压倒性优势)。——不过,在经历近现代“玛雅文明”的重新构建之后,其他人群也逐渐开始具备玛雅认同,处于正在经历融合的过程。

这一小类似乎主要集中在南美,而且南美三个分布范围最广的庞然大物均是如此(另外会举一个北美的例子)。在不清楚殖民历史的情况下,会对于这几个大语系的命名方式感到非常奇怪,某一种语言有什么资格能代表整个语系?答案简单粗暴,就是和殖民史有关……当然确实,殖民色彩比较重,并不太恰当。

(注:理论上应该把 Cariban 译作“加勒巴”甚至“加里巴”,但考虑到“加勒比”已经深入人心,故采用“加勒比亚”以兼顾)

有42种语言,论语种数量为南美第5(次于阿拉瓦卡、图皮亚、帕诺-塔卡那、克丘亚),论分布范围则要大于帕诺-塔卡那。根据加勒比语(又称卡里那语)来命名,因为加勒比人和阿拉瓦克人属于西班牙人最早接触到的两类民族,南美北部的两个庞然大物也由此得名。

之所以从这样一个没有位居首位的语系开始,是因为“加勒比海”后来变得非常出名。也由此,引发了“加勒比亚语系”命名上的第一个尴尬之处——很容易定位该语系大致的区域,同时也很容易定位错。看到它可以立刻反应出在加勒比一带苹果申请美国id,但是目前完全不分布在加勒比海上,只是主体位于加勒比海南岸。

目前加勒比海岛上已经基本没有原住民语言的存在了。受奴隶贸易影响,各个岛上通常都形成了对应宗主国语言的克里奥尔语/混合语,这才是加勒比海在语学上最重要的特征。

同时如何申请一个苹果外区id账号,第二个问题是——不仅现在加勒比海上不说加勒比亚语,就算在殖民者到来之前,这里也不纯粹是加勒比亚语的天下,加勒比海岛的通用语其实是阿拉瓦卡语系下的塔伊诺语(Taíno);另外小安的列斯群岛也有相当一部分伊涅里语(Iñeri)使用者,尽管在加勒比海(最后是多米尼加共和国)上灭绝,但其后代加里富那语( Garifuna)仍然在莫斯基托海岸上存留,是目前北美洲唯一的阿拉瓦卡语。

而同时,小安的列斯群岛的另一种语言才是加勒比语(图中标为 Karina),和特立尼达岛上的 Yao 均属于加勒比亚语系。——关系比较乱,但总之要说明的是,在曾经的加勒比海上也不是仅仅由加勒比亚语主导,这个语系的主体始终都在南美洲北部。

上面顺带着讲了那么多,终于轮到南美之王正式登场了——有77种语言,在亚马孙盆地边缘一圈到处都是,可以在南美除了厄瓜多尔、智利和乌拉圭以外的所有10个国家/地区内找到。

当然,从整体上来看,用位于加勒比海上的阿拉瓦克语来指代这样一个庞大的语系,相当于是把南美部分给无视了,确实也很不恰当,殖民色彩极重。

我写这篇文章的原因其实和之前看到这个问题也有关系,相信有了上面的铺垫,就能明白“图皮语”这个概念可能有歧义,到底指的是“图皮语”(Tupí)还是“图皮亚语系”(Tupían)。

图皮亚语系在语种数和分布范围上都仅次于阿拉瓦卡语系,主要集中在亚马孙盆地内:

图皮人是葡萄牙人来到南美时最早接触到的民族,也是当时亚马孙雨林(包括巴西高原的一些沿海雨林)最重要的民族之一。直到18世纪,图皮语始终是葡属巴西的通用语,并留下了大量文字记录,后来地位才逐渐被巴西葡语取代。这也就导致图皮语出现了一个很奇妙的阶段——古典图皮语。不是所有的语言都有“古典”时期,这通常指的是某一时期有大量文本遗存,而美洲本土语自源的“古典时期”只能来自产生过早期文字的中部美洲,玛雅文字便是其中最成熟的一种;而像古典纳瓦语则是以传教士用拉丁字母记录的文献为主,兼有图画文字的抄本。

另外,由于近现代以来图皮语的没落(目前只有涅恩雅图语/Nheengatu 一种后代),加上巴拉圭的双语政策,导致同语系的瓜拉尼语成为了非母语的学习者最多、全美洲情况最好的原住民语言,也偶尔可以见到诸如“图皮-瓜拉尼语系”的称呼。不过实际就谱系来看,这两者差异不算太大,“图皮-瓜拉尼”只有图皮亚语系下语支或语群的地位,和「把班图语支称为“班图语系”并无视大西洋-刚果语族/系的存在」较类似,也算是以偏概全。

好了,南美举了三个例子后,回到北美西海岸。Salish 来自美国蒙大拿州境内萨利什语的 séliš“人”(他们现代的名称是下图中的 Kalispel-Pend Oreille,Kalispel 源自自称 Ql̓ispé,Pend Oreille 是法国人给的),不过他们未必是最早和美国人接触的,但确实是最早和美国建立外交关系的。

而和美洲普遍情况一样,其它萨利沙语系使用者并不认可 Salishan 的称呼,比如在 lemorpheus 注销前写的这个回答里(也感谢他对本部分和前面瓦卡什语系的帮助),使用者就自称为 hən̓q̓əmin̓əm̓(这其实还是个方言,语言叫 Halkomelem,但他们或许都不认可这个名字)。

大概就是这一类里唯一的语系了。它广泛分布在北美西部和北部,共时层面断成三片,主体部分位于美国阿拉斯加和加拿大西部,一小片在美国西海岸,还有一小片在美国南部(其中纳瓦霍语和周边语言构成普韦布洛语盟)。这一语系最早由萨丕尔提出,当时包括阿萨巴斯卡语族(主体部分)、申吉特语(Tlingit /ɬɪ̀nkɪ́tʰ/,下图中唯一的黄点)和海达语(后来认为是孤立语),dene 是阿萨巴斯卡语族里广泛用于表示“人”的词,而在申吉特语里用 na(和 dene 后面的-ne 同源),海达语则用 na 表示“居住”。

后来将海达语排除出纳-德内语系,并新发现了一种伊亚克语(Eyak /ʔiːjaːq/),也处于一个非常靠外的位置。下图就是把申吉特语排除之后的情况,可以发现和上图的布局也差不多,黄点是伊亚克语。

也因此,Glottolog 上采用的称呼是“阿萨巴斯卡-伊亚克-申吉特语系”,从而突出了两种位于极外层的语言,即采用了第二类“根据谱系”的命名方式。而在不清楚命名原则的情况下,如果以为“纳-德内”是来自两种语言的组合,会发现根本找不着。

(P.S. “阿萨巴斯卡”是加拿大西部一个湖的名字,所以用它来命名这样断成三片的语族其实有点尴尬)

当然,同源词最大的用处还是在于——用同源词在不同语族/语支中的变化作为谱系划分标准,举两个例子:

最著名的就是印欧语系里的 centum 和 satem 的区别,取的是原始印欧语里*ḱm̥tóm“百”在后世语言中的不同演化形式,最重要的就是看硬腭音*ḱ 变为/k/还是/s/。(

只是印欧语系的语族定名有很强的传统文化背景在,比如“安纳托利亚”的分离时期比“凯尔特”要早得多,如果是个欠发达地区的小语系,那很可能就这么命名

突厥语系里 oghur(又称“保加尔语族”,和共同突厥语并列的那个最外层)和 oghuz(共同突厥语下的一个语支)之分也是同理,因为原始突厥语的*ŕ 在两个语族中一个变/r/一个变/z/。

上面已经顺带着指出了一些问题,这里把几个最大的留到最后。下面四个大语系中的三个已经在本回答里写过概况:

注意,以下环节可能比较激进,因为试图挑战的对象太庞大了,已经被大量的文献采用,想要做出改变是不太可能的,纯属口嗨。

这一问题我在讲巴布亚的这篇文章里已提及,因为“南岛”的情况和第四类“取代表”很像,只不过是取了其中一类谱系相对靠下的、且真正出海的马来-波利尼西亚人的语言分布范围,事实上谱系更靠上的语言全部都窝在台湾岛,像巴宰人、道卡斯人、泰雅人、布农人、鲁凯人、阿美人、排湾人等等全都没有出海,而他们彼此之间语言差异极大,分化时间远远早于出海的马-波人各支系。也因此,我在文中一直坚持用“马波人”代替“南岛人”,尽管确实看起来比较奇怪。

当然,其实去看南岛语系谱系时会有种强烈的错位感——是不是应该把真正出海的马-波语族称为“南岛”,而留在台湾岛的给个统称“台湾”,也即总体名字该叫作“台湾-南岛语系”呢?

(我是认真的,“大鱼”是大鱼河/Great Fish River,南非南部的一条河,“刚果”不也是刚果河嘛)

从头说起,尽管尼日-刚果语系相对于尼罗-撒哈拉而言争议偏小一些,但因为仍然证据不够充分,所以像 Glottolog 上就也并不承认“尼日-刚果语系”的存在,直接把语族上升为语系,我这里姑且也这么干,把其中占据绝大部分的大西洋-刚果提升为语系看待。(就算去除其它语系,大西洋-刚果拥有1403种语言,仍然是妥妥的全球第一)

当然,尼日尔河和刚果河是非洲非常重要的两条河流,意义相当于我国的长江黄河,如果我国境内有什么东西需要以“黄河”或“长江”来命名的话,也必然是首推的。——但因为本文就是想要挑刺,如果重新审视一下“尼日-刚果”的名字,就会发现它貌似囊括得不太全面——尼日-刚果语南端延伸到刚果河流域的东南方向,直抵南非东部;西端的尼日尔河流域也没囊括到塞内加尔、冈比亚、几内亚比绍境内的一些语言,且西非因为语言差异巨大,漏一点区域就可能把一个语族/语支丢掉了(这里就是北-中大西洋语族/语支)。

不过说实话,“大西洋-刚果”这个下级单位的名字看上去囊括的范围还大一点,至少把大西洋一端给填上了,就是南边怎么办。如果按照以河流命名的传统,那么就要提到我前面说的大鱼河了,因为它有较重要的历史意义。在荷兰人到达之前,班图人的最南支——科萨人的分布范围最西端大致就到大鱼河(尽管以西确实还有一些分布),并没有继续向西吞并“科依桑人”的地盘,因为即将到达地中海气候的范围,而班图人从赤道扩张时带上的作物不适合地中海气候夏季少雨的气候。

之后,大鱼河成为了开普殖民地和科萨人领地之间的界河,也是科萨战争时的前线地带。同时也因为科萨人、祖鲁人、索托人等班图群体有相对较强的武力,所以荷兰人带去的阿非利卡语没有对原班图语分布范围内造成太大威胁,而是大幅度挤压了“科依桑语”的地盘,将其在今南非国内基本消灭,只在纳米比亚和博茨瓦纳的沙漠中还得以苟延残喘。

当然,如果觉得“大鱼”太奇怪,换成诸如“大菲什”之类的音译也可。就是“大”不能去,避免和纳米比亚境内的一条河重名。

终于,在接近结尾的地方,迎来了本文最最重要的问题——“汉藏语系”这一名字恰当吗?我当然知道,如果在没有铺垫的情况下贸然探讨汉藏语系的命名,势必会引来大量争议,所以我才把它埋到了这篇文章的末尾,希望能姑且劝退一些奇人。

“汉”毫无争议,无论是分布范围还是使用人口,都是该语系里妥妥的第一;甚至谱系上也没有问题,汉语族应该就是该语系最早分家的一支语言。——问题出在“藏”上面。藏语的分布范围确实在该语系内仅次于汉语,书面记录历史也仅此于汉语(可能再加尼瓦尔语),但藏语的使用人口(600万)比缅语(3600万)要少得多,这点就已经很尴尬了。更麻烦的是,如果认为“汉藏”这个名字是根据谱系,那么在撇掉最外层的汉语之后,“藏”线种语言吗?很显然不行吧,剩下的语言是不是应该找个地理范畴呢?

该语系的全貌是下面这样的。无论是“汉”还是“藏”,主体都分布在喜马拉雅山脉以北以东的地区(不过藏语取的点可能偏少),而该语系中语言最复杂的地区一个在我国西南角,另一个就是喜马拉雅山脉以南(并加上印度东北)。我曾见过彝族朋友坚决不认可自己的语言居然在汉藏语系中“藏”的下面,同样地通常人们谈起汉藏语系时也根本无法想象「有超过半数的汉藏语不在我国境内,而是在印度、尼泊尔、不丹、缅甸等国」,更有人觉得掌握了汉语和藏语后就可以一窥汉藏语系全貌了。

“汉藏”相当于取了两个代表,但第四类“取代表”的弊端是很明显的。重申一下,我不是说藏语不重要,而是说取“汉”和“藏”是没有办法囊括整个语系的;像这种庞然大物一样的语系通常只能用地理概念,从“汉”到“藏”的跨度不够,甚至用“汉缅”都会更好。如果不想纠结到底各地派谁代表,那就取喜马拉雅山的名字,命名为“跨喜马拉雅语系”——这一称呼不是我新创立的,确实已经在小范围使用了。

最后这个……或许得说是统战问题。因为汉藏语系在国际上也确实这么叫,问题姑且不大,但“壮侗语系”就不太一样了。本文中之前也提到过这个语系,但用的都是“仡台”(Kra-Dai)——这也是比较符合国际惯例的名称,属于第二类“根据谱系”的分法,仡央语族通常都被认为是该语系非常靠外的一支,所以语系名字里带个“仡”是毋庸置疑的。至于剩下的里面,台语支占据压倒性优势(基本除了拉珈语、标语、侗语、水语、黎语、临高语等少数以外全都是),也算是可以作为代表。

另外也有个很常见的名称是 Tai-Kadai,但 Kadai 中“ka”来自仡央语而“dai”来自黎语,因为这二者关系其实并不接近,所以也不恰当。至于“壮侗”……只能说是非常独家,用了我国两个民族的名字,但无论是使用人口还是分布范围,壮语都比不过泰语(就算仅考虑狭义的中部泰语也是如此);谱系上就算壮语和侗语分属不同语支,但也赶不上和仡央语的差异。

好了,口嗨完毕,结束。这回本来只想简单地写写,结果一不小心写了那么长一篇,相当于用13000字环游了世界。当然由于本人知识所限,可能是谱系分类上还存有过时的偏见,也可能是没有充分理解命名的渊源以至于归类不当、甚至是错误地进行了批评,还请各位多多指正。

THE END
喜欢就支持一下吧
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称