汉民族血统浅析人类Y染色体谱系树(图)【以Y染色体单倍体类型研究看非洲起源论】先讲讲Y染色体单倍体类型的方式分析的原理和方法。人有46条染色体,其中44条为常染色体,X、Y两条为性染色体。XY组合的为男性,XX组合的为女性,所以,Y染色体只能父子相传,我们研究Y染色体,可以比较清晰的发现人群的迁徙和发展。为了研究Y染色体的单倍体类型,我们绘制了人类Y染色体谱系树,见上图,我们按着Y染色体单倍体的不同把全人类(包括非洲)分为18个类型(用从A到R十八个字母代表),出现频率高,数量多的类型单独列出(如O、N),把小概率出现的类型列入上级母类(如F、P),这也就是类型上有逻辑上重合的缘故,这样做是为了使分类清晰,分析方便!非洲人是人类的大本营,今天,所有人类的Y染色体单倍体类型都能在非洲找到(M168\YAP\M130)。而非洲以外的居民,他们都是一支出非洲居民的后裔,他们的Y染色体上都带有M168的突变点。人类刚出非洲,都带有M168的变异点,此后,M168又发展出三个支系,C—M130、D—YAP、F—M89,它们下又有不同的子类型。F—M89是现代人中占压倒性的类型,大概全世界80%以上的人都有这个变异点。F—M89有很多子类型,其中,K—M9是最重要的一个支系,亚欧大陆上,除了西亚地区和西伯利亚,世界岛上绝大部分民族都由K—M9的子孙构成,今天中国人(汉族)中,96%的人都是K—M9类型。K—M9下面也有很多子类型,最重要的有两个,一个是ON—M214,另一个是P—M45。前者(ON—M214)主要分布在东亚、东南亚、北亚东部、部分太平洋岛屿(以上都是O—M175子类型)和乌拉尔山两侧、北欧北部、东欧北部和北极圈内的爱斯基摩人(以下都是N—M231子类型)。中国人主体类型就是O—M175。后者(P—M45)主要分布在欧洲大部(R—M173子类型)、西亚的伊朗、南亚的印度(R1a—M17子类型)、美洲印地安人(Q—P36子类型)等地区。其中,R—M173(包括M17),被认为是原始雅利安人的基因。回过头来再说最早的一支。海洋居民,C—M130走的路线大概就是沿着海岸出发,从阿拉伯半岛—伊朗—印度—中南半岛,此后,这批M130的子孙分为两支系,NO.1支系向北进入西伯利亚,并最终进入了北美地区;NO.2支系向南进入澳大利亚,并扩散到整个太平洋诸岛。虽然我们的基因树上C—M130画的比较简单,但实际上C—M130并不单一,他们类型众多。今天C—M130的后代主要分布在印度南部、北亚东部、日本、北美西部、澳大利亚、太平洋诸岛。在东亚地区,外蒙地区比例非常高,达到58%,还有哈萨克人、吉尔吉斯人、布里亚特人、比例都在60%以上,这些人群的类型(包括北美地区)都是C3—M217;M130的其他类型还有,日本的阿伊努人90%以上是C1—M8,另外,现代日本人(6.5%)、朝鲜人、满州人、阿穆尔人中,也有一定数量的C1。C2—M38,主要分布在澳大利亚和太平洋诸岛屿,C4、C5主要分布在南印度地区,在当地民族中能达到20%。在现在汉族人中,M130的比例小于3%。D—YAP又被称为小黑矮人基因,是一支非常古老的基因,它和C—M130几乎同时走出非洲。现在D—YAP类型主要分布在印度安答曼群岛的安达曼人(100%)、藏族(58%)、土家族、彝族、瑶族、日本(34.7%)、朝鲜、满州人、缅甸人、克钦人。在汉族人中,D—YAP出现的频率小于1%。推测的他们迁徙的路线(见下图)Y染色体变异数量多少并不能用人口数量来衡量,很多人口众多的大民族都是由一个小人群由于某种原因迅速壮大而来的,如历史上曾建立了强大帝国(典型的是汉人、阿拉伯人),近代的高技术革命和殖民(如英格兰人、西班牙人),这些人群的同源性强,Y染色体的变异类型并不特别丰富,相反,一些非常古老的小民族,其Y染色体变异类型却十分丰富。关于中国人的基因构成,可参考下图。【分子生物学的方法研究汉族人的民族起源和基因结构】今天的汉族人,占压倒性主体的是O—M175。具体分析,在M175下还可以细分为最大三个子支系(其他N多小类型都不算):O1—M119、O2—M95、O3—M122。这三个子类型地理分布很有意思:O1—M119广泛分布在从北亚到东南亚,但在最中央的黄河流域竟几乎找不到!在贝加尔湖畔的布里亚特人,其O1—M119的比例最高,达34%,另外,北亚地区的外蒙、满州、朝鲜、日本、堪察加人等民族也有O1—M119类型,但一般比例不超过10%,中国南方,浙江、上海、福建等省份,O1—M119比例也较高。而在黄河流域的山东、河北地区的汉族人中,O1—M119类型的比例都小于5%,在陕西、山西、湖北等省,没有发现这种类型,出现频率为零,M119的分布呈现的是两头大中间少的格局。O2—M95类型主要分布在东南亚地区,在泰国高达55%,从泰国向北在递减,从泰国向南也在递减,可以推论O2—M95变异最初出现在东南亚地区,并向西周扩散。在东亚地区,只在朝鲜人、日本人、阿穆尔人中有一定分布,其中,在日本人和朝鲜人中,O2为O2b,比例超过30%!在山东、河北、甘肃的汉族人群中,出现频率全部为零,找不到这种类型,在南方汉族人中,能找到出现概率非常低的M95。O3—M122类型是数量最多,分布最广的一种。从北亚向南到爪哇、新西兰,从日本向西到西藏、哈萨克人,全部能找到O3—M122的分布。从出现频率上看,O3—M122的出现频率最高地区为中国的云南地区、印度的那加邦土著民族上,很多民族中出现频率为100%,如独龙族等。在黄河流域的河北、陕西、山东,长江流域的湖北、安徽、四川、江西等地区的汉族人中,O3—M122都超过了80%。在北亚地区,O3—M122数量比较少,外蒙人中超过了30%,阿穆尔人也超过了40%,以及朝鲜人,除这三个人群外其他都比较少,在艾温基人出现频率为零,在布里亚特人也为零,在日本人中为22%。在东南亚地区,M122数量比较多,只有泰国、柬埔寨等地区略少,其他地区一般超过50%,出现频率从中国向南逐渐递减,到了爪哇人中出现频率只有20%,在汤加、新西兰的毛利人人也有出现,但比例都不大。M175这三个子类型的地理分布告诉我们一个信息,我们可以推论出东亚各民族的发展史。东亚黄种人开始可能分为四个大集团:北亚人群、黄河上游人群、黄河下游人群、中南半岛人群。北亚人群代表了阿尔泰语系的民族,由于生活在气候寒冷地区,无法种植农作物,其他人群都无法涉足,所以很难取代他们。黄河上游集团代表了古代汉藏语系民族(先羌,标志性基因O3—M122),黄河下游集团也是一个古老人群,他们特有的是O1—M119。大约在6~5千年前,古代汉藏语系先民开始分化,一支向西、向南发展,成为了藏缅语族、另一支向东发展,就是汉语族。汉语族部落并击败了黄河下游的古老居民,这些具有M119的民族失败后开始分化为两支,北支M119进入了辽河流域,并深深影响了西伯利亚和北亚居民的基因构成,成为阿尔泰语系民族中普遍存在的基因,南支M119向南发展,成为后来的“百越”。从此,M119基因从黄河流域消失,取代他的是带有M122的先羌人(汉语族部落)。这段部族迁徙史,也许就是我们民间口口相传的著名的黄帝战胜蚩尤的历史传说!虽然我们找不到当年的战争遗迹,但我们完全可以找到吻合的考古和基因的证据:考古上,山东的大汶口文化从此消失了,取代它的正是从陕西河南来的龙山文化,此后山东存在的文化就是山东龙山文化!在基因上,证据更加明显,山东、河北两省的汉族人中M122和M119的比例接近50:1,超过95%人以上都是随黄帝东来者(先羌部落,M122类型)的后代。经过这次原始的部落战争,汉语族的各部族控制了整个黄河流域,他们建立了数量众多的方国,这种状态持续了大约近2000年。大概在距今3100年前,一支小部落从甘肃天水迁徙到了陕西周原,就是周族人。他们在周武王的带领下,周族人消灭了商朝。灭商后,周武王率领300辆战车和5000虎贲,用了三年时间,消灭了99个方国,征服了652个方国,俘虏了410万战俘《逸周书·世俘解第四十》。在此后的一百多年间,西周分封了大量诸侯国,周族也随着分封扩散到了全国。周族人称自己国家是“有夏”,此后各诸侯国都自称“有夏”,对外统称自己“诸夏”,夏者,本意是区域广大。周族自称自己的本民族为“华”,称外族为“夷”(异),此后凡是与周族有同源关系的血亲部族都开始自称“华胄”,称外族为“非类”“夷(异)人”,意思是非华族类,华者,本意就是高贵壮丽。从此,“华夏”也就成了这些诸侯国的统称,这也是中华人民共和国中“中华”两字的来历。周族人的语言叫“雅语”(夏语),在全国通行,孔子讲学,学生来自不同的诸侯国,但孔子的话他们都听得懂,因为孔子说的是当时的普通话——“雅语”,这在《论语》里有:“子所雅言”的话,不说“雅语”就是被称为“野言”“非文”,由于有着交流需要和文学推进,“雅语”最终成为了全国通用的语言,也就是后来我们说的汉语。到了公元前221年,秦始皇最终将这些互相强烈认同的割据国家统一起来,后来又经过汉朝的统一和强盛,华夏族终于发展成为汉族。先秦的发展,使得汉语族各支系语言全部统一到周族的“雅语”下,经过长期的融合,不断的人口迁徙,到今天,长江以北的汉族人,各地之间差异已经非常小了,从山东到甘肃,都没什么差异。秦汉以后,中原王朝开始了对长江以南地区的军事和政治控制,大量的汉族移民开始迁往南方,今天,南北汉族在Y染色体上差异很小,90%的相似性,也就是南北方汉族父系都是同源的。南北汉族的差异主要体现在mtDNA上,也就是母系来源上。简单的说,南方汉族基本可以表示为=父系(北方汉族Y染色体)+母系(北方汉族线粒体mtDNA+溶入的南方很多的民族的线粒体mtDNA),南方汉族不但和北方汉族在mtDNA上有差异,其实他们之间也不同,湖南的汉族和福建的汉族mtDNA就不同,甚至同是广东人,广府人和客家人在mtDNA上也不同。怎么解释11亿南北汉族人在父系上全部同源而母系上差异明显呢?其实也很简单,看看50年代时内地人迁往拉萨的情况,当时的规定,进藏只有部队团级以上干部、地方处级以上干部才可以带家属,那些年青战士和青年工人由于无法带家属,他们娶的都是当地的藏族女青年,今天拉萨、日喀则等地有大量汉藏混血儿,他们青一色都是父汉母藏,就是由于这个原因。这在汉族南迁的历史也是类似的,迁往南方的汉族主要是由于服兵役、逃避战乱、因罪流放等因素,这些人基本都是男性,带家属的情况不多,所以他们肯定是娶了当地的女性,就造成了南方汉族有着和北方汉族相同的父系祖先,却有不同的母系祖先。(其实总体来看,在南方,来自北方汉族母系的mtDNA还是占多数,也就是一半以上的南方汉族其母系祖先也是来自中原地区的,但个别地区这个比例很少,而南方当地女性的mtDNA部分地区却可以达到85%,如广东的一些地区)。金力李辉(复旦大学)等人的论文,汉族人迁徙模式,南迁图例