数据揭秘历史 盘点《三国演义》人物阵营变化

时间:2018-11-2 14:49:53  作者:小飞侠  来源:娱乐资讯网  查看:21  评论:0

作为中国文学史上第一部章回小说,《三国演义》是历史演义小说的开山之作,为我们展示出了一幅波澜壮阔乱世英雄争天下的历史画面,故事情节随着几大人物阵营的演变紧紧抓牢看客眼球。那么随着时间推移,三国人物阵营是怎样变化的呢?狗熊会根据《三国演义》原著电子版汉语文本,应用文本分析、关联规则挖掘和社区探测技术,数据挖掘角度分析三国各个时期的人物阵营情况。

01 数据说明

1、先看看人物总表情况:

(1) 人名总表中包含1152人。

(2) 不包含“单于”、“督邮”、“山神”、“梨树神”、“师婆”等不确切指代某一个人的人名。

(3) 收集了人物的姓名、字号和别称。有些人物的字号,虽史书上有记载,但在《三国演义》中未提及,不列入此表。

2、统计每一自然段中的出场人物

根据人物总表中的姓名、字号、别称,统计每一自然段中出现的人物。例如,某自然段中提到曹操孟德阿瞒,均认为曹操在该段出场。有两种情况需要特殊说明:

首先,根据作者用词习惯,若某一自然段中用某人物的“名”代替该人物,则上一自然段中提到过此人。处理方法为:如果第i自然段出现了人物x,则在第i+1自然段需对人物x的“名”进行匹配,并以此递归。

其次是特殊人物的处理。例如:“张飞”和“张翼”。为了准确地统计此二人的出场频次,将“张翼德”统一替换为“张飞”。

3、把原著一百二十回,根据故事情节划分为八个部分。

02 描述分析

1、人物出场频数直方图

从图中可以看出,《三国演义》的三大男主角为曹操、刘备和诸葛亮,他们拥有极其复杂的人物关系,于整套书中出场次数最多。重要配角有很多,如关羽、赵云、孙权、张飞、司马懿、袁绍等人物,他们出场次数也相当多,配合三大男主角演义,为小说增添故事性和艺术性。毛宗岗称三国有“三绝”:智绝-诸葛亮、义绝-关羽、奸绝-曹操,均属于前四号人物。由此图还能看出,《三国演义》主要讲述了男人之间的故事。

2Apriori关联规则挖掘

Apriori算法是一种关联规则挖掘方法,最早被应用于购物篮分析。

在本案例中,Apriori算法用于准确并快速地发现多次在同一自然段中出现的二人组和三人组,并统计这些人物组合的共同出场频次。

应用Apriori算法挖掘出的亲密二人组亲密三人组如下:

经典故事和相关人物:青梅煮酒论英雄(曹操、刘备),白帝城托孤(刘备、诸葛亮),鞭打督邮(刘备、张飞),火烧新野(赵云、诸葛亮),千里走单骑(关羽、刘备),赤壁之战(曹操、诸葛亮)。

《三国演义》故事情节围绕曹操、刘备、诸葛亮三大男主角展开。由于蜀魏两大阵营的战争较多,三男主经常一起登场。涉及到曹操、关羽、刘备三人的经典故事有温酒斩华雄、斩颜良诛文丑、挂印封金、千里走单骑等;涉及到刘备、关羽、张飞三人的经典故事有桃园三结义、三英战吕布、三顾茅庐、古城相会等。

3、三国人物关系网络

数据揭秘历史__盘点《三国演义》人物阵营变化

网络中的节点代表三国人物,边的粗细正比于两个人物共同出场的段落数。某节点的即网络上与该节点相连接的节点数量。某人物的度就是和他一起出场过的人物数。为了可视化方便,左图仅展示了《三国演义》全文人物关系网络中度大于100的人物及其相互关系。该网络人物关系错综复杂,后文将通过社区探测算法挖掘网络上潜在的人物阵营。

4、人物在网络上的重要性

本案例用节点的度来刻画三国人物的重要性。如图:

数据揭秘历史__盘点《三国演义》人物阵营变化

从度的排序可以看出,最重要的三个人物仍然是曹操、刘备和诸葛亮。

曹操结束割据局面,统一北方,打击匈奴、乌桓、羌等少数民族对中原的入侵。“聪明透顶又愚不可及;狡猾奸诈又坦率忠诚;豁达大度又疑神疑鬼;宽宏大量又心胸狭窄。” ——易中天评曹操

刘备慧眼识才,建立了蜀国,使汉朝刘氏香火延续四十多年。“弘毅宽厚,知人待士,盖有高祖之风,英雄之器焉。” ——陈寿评刘备

诸葛亮辅佐刘备建立蜀汉政权,促进巴蜀地区经济恢复和发展,是忠臣与智者的代表人物。“鞠躬尽瘁,死而后已。” ——诸葛亮《后出师表》

03人物阵营探测

1、定义网络上人物亲密度

亲密度:定义两个不同人物之间的亲密度为他们同时出场的自然段数,也称共现数。

自信度:每个人物的自信度定义为该人物出场自然段数除以所有人物平均出场自然段数。

由亲密度和自信度构造出人物之间亲密度矩阵。有了亲密度矩阵,就可以对三国人物进行阵营探测了。后文将针对每一阶段计算亲密度矩阵。

2Affinity Propagation算法

Affinity Propagation(以下简称AP)是一种聚类算法,它根据样本点之间的相似度进行聚类,不需要事先确定类数,而是根据输入的调节参数来调整类数,同时能够给出每一类的代表点(或中心点)。

AP算法在本案例中用于三国人物网络的社区探测(Community Detection),发现各阶段人物阵营划分以及各阵营的核心人物。把亲密度矩阵作为相似度矩阵即可。

3、三国各阶段人物阵营探测

第一阶段:黄巾起义

黄巾起义是东汉末年的农民起义,朝廷腐败、边疆战事、沉重赋税使贫苦农民揭竿而起,为东汉末年军阀混战揭开了序幕,更为三国分立种下远因。黄巾起义时期主要划分为七大阵营,分别以刘备、封谞、朱儁、蹇硕、张让、曹节、张举为各阵营核心。其中,规模最大的阵营是以刘备为核心的,起义后刘备讨伐黄巾军有功,混得一官半职。

第二阶段:董卓之乱

董卓之乱发生在东汉中平六年(189年),董卓率兵进入洛阳,废少帝,立刘协为帝,自为相国独揽朝政。次年,袁绍讨伐董卓,董卓败,西迁前大肆烧掠,后被杀。此为三国乱世之开端。汉沦丧于董卓,曹操、袁绍等诸侯纷争,郭汜、何进等乱世豪杰,孙坚、刘备等英雄辈出。董卓之乱,乱,乱,乱!其中,规模最大的阵营以曹操为核心。这一时期,曹操招精兵,伐董卓,崭露头角,逐鹿天下。董卓之乱是曹操霸业的序幕。

第三阶段:官渡之战

官渡之战,东汉末年“三大战役”之一,曹操与袁绍在官渡(河南中牟东北)展开战略决战,曹操以少胜多,击溃袁军主力。曹操是官渡之战的核心。袁绍及其武将谋士在曹操阵营中相爱相杀。刘备及其下属流窜与两方之间,本想借台唱戏,结果意外频出只得匆忙跳河。此时的孙策,隔岸吃瓜观虎斗。此战是曹袁两家争夺北方霸权的转折点,奠定了曹操统一中国北方的基础。

第四阶段:赤壁之战

赤壁之战是孙权、刘备联军于建安十三年(208年)在长江赤壁一带大破曹军的战役,曹操北回,孙、刘各自夺去荆州一部分。这一时期,大概就是两个农民刘备、孙权斗曹操这个地主吧!此次战役,曹操成功浪费一个赛点,失去了短时间内统一全国的可能性,孙刘双方实力迅速壮大,三分天下雏形形成,三足鼎立已为大势所趋。

第五阶段:三足鼎立

三足鼎立是指三国时期魏、蜀、吴三分天下的局面。罗老把这一时期的笔墨都留给了以刘备和曹操为核心的蜀汉和曹魏两大阵营。问题是,孙权为什么会被划分到了蜀汉阵营?这说明,三足鼎立时期的主要矛盾,产生在曹魏阵营和蜀汉阵营之间。也就是说,刘备扛起了斗地主的大旗!经常在一起的可能是朋友也可能是敌人,如马超被划分到曹魏阵营。

第六阶段:吴蜀之争

吴蜀之战的夷陵之战是三国时期蜀汉、孙吴之间争夺荆州的重要战役,蜀汉惨败,永远失去荆州。此时阵营核心多为吴蜀之英雄豪杰,如韩当、诸葛亮、关羽、关兴等;曹丕羽翼已丰,成为阵营核心。这一时期,关兴随先主刘备一起伐吴,诸葛亮持反对意见,孙刘两败俱伤,曹丕本可趁机灭蜀却进攻东吴,从而缺错失了统一全国的大好机会。

第七阶段:六出祁山

六出祁山是诸葛亮恢复与吴联盟、平定南中后,曾六次从祁山出兵攻魏。诸葛亮必然是这一时期的最关键人物。诸葛亮六出祁山长达七年之久,虽苦心筹谋,奈何国力不济,师劳而功微。“孔明六出祁山前,愿以只手将天补;何期历数到此终,长星半夜落山坞!”

第八阶段:三国归晋

分久必合,合久必分,蜀汉灭亡,公元265年司马炎为相国、晋王,同年十二月代魏称帝,灭蜀汉,公元280年灭东吴,三国归晋。三国归晋不应该司马懿为核心吗?为什么会是诸葛亮?由此看来,我们的直觉可能都错了!诸葛卧龙英魂尚在,冥冥之中也阻碍着司马家族统一的进程。

4、人物阵营变化追踪

接下来,介绍一下三大男主角的阵营变化。

曹操于董卓之乱后尽显雄才伟略,官渡之战以少胜多,壮大了以自己为核心的阵营,赤壁之战战败,自此三足鼎立局面形成。

刘备于黄巾起义后崭露头角,赤壁之战中实力迅速壮大,形成以自己为核心的一大阵营,此后三足鼎立局面形成,吴蜀之争损失惨重,此后形成以诸葛亮为核心人物的阵营。

诸葛亮于赤壁之战阶段出山,而后在蜀汉为相,“鞠躬尽瘁,死而后已”。刘备去世后接替刘备统领蜀汉阵营,为蜀汉江山立下汗马功劳。

04研究结论

通过《三国演义》人物阵营变化,我们可以看出:

第一、乱世出英雄;

第二、没有永远的朋友,也没有永远的敌人;

第三、敌人也可以很亲密;

第四、分久必合,合久必分。

 

文章源自狗熊会:狗熊会是致力于数据产业的高端智库!聚数据英才,助产业振兴!狗熊会以数据治理为核心,以数据资源资产化为目的,帮助合作伙伴制定数据战略,培养数据人才,研究数据业务,发现数据价值,推动产业进步!


相关评论

图库精选

联系我们 - 服务报价 - 关于我们