中新社成都7月11日电 题:唐诗宋词能否用大数据解读?
——专访四川大学文科讲席教授、我国词学研讨会会长王兆鹏
中新社记者 贺劭清
白居易诗作量位居唐代诗人之首,影响力却没进入前十;宋词名篇最多的不是苏轼、辛弃疾而是周邦彦;归纳影响指数标明,杜甫高于李白、辛弃疾强于苏轼;张若虚《春江花月夜》、陆游《卜算子·咏梅》在近现代才开端受注目……用大数据来显现和验证唐诗宋词,定论超出许多人的幻想。
唐诗宋词是我国文学史上的两座高峰,但归于美学领域的唐诗宋词能否用大数据解读?大数据研讨唐诗宋词取得了哪些新发现,又有什么限制?四川大学文科讲席教授、我国词学研讨会会长王兆鹏近来承受中新社“东西问”独家专访,作出深度解读。
现将访谈实录摘要如下:
中新社记者:唐诗宋词是我国文学史上的两座高峰。从大数据看,唐诗宋词是否到达空前的高度?别离有什么特征?
王兆鹏:数据显现,唐诗宋词作家、著作量均到达了空前的高峰。现在撒播下来的唐诗超越5万首,而东汉到隋末近600年的诗篇总共才5000余首。唐诗比之前的八代诗增加了7倍多,诗人由600余位增加到3000多家,诗人和诗作都到达了史无前例的量级。
宋词是我国词史上榜首座高峰,有词人1497家、词作21085首。相较唐五代,词人词作都增加了10多倍。宋词用调近900种,在唐五代词的基础上增加了700余种。词调多,意味着词体的丰厚。唐五代词人中唯温庭筠、冯延巳、李璟、李煜有词集传世,而宋代则有300多位词人有词集撒播。词人有词集传世,意味着著作多、知名度高,社会需求量大。宋词之所以撒播数量不如唐诗,其间一个重要原因在于宋词是经过口头传唱,相当于现在的流行歌曲。口头传唱的著作,许多已失传。
衡量文学开展,著作数量是一个重要方面,但最要害仍是要有精品。要说我国前史上发生巨大诗人、词人最多的朝代,无疑是唐宋。尽管现有技能还难以精确衡量著作艺术价值的凹凸,但能够用大数据来衡量著作影响力的巨细,分分出哪一首著作最受群众欢迎。
艺人诵读李白的《将进酒》。中新社记者 杨华峰 摄
中新社记者:唐诗宋词归于美学的领域,为什么想到用大数据剖析唐诗宋词?
王兆鹏:给文学著作排座次、定甲乙,并不是今日才有的时髦,而是古已有之。最早给诗人区别品第等级的,是南朝梁代的钟嵘。他在《诗品》中将汉魏以来诗人分为上中下三品,以评量其好坏。唐代张为的《诗人主客图》,把中晚唐的部分诗人分为主、入室、升堂、及门等等级,也是一种品第批判。
在我国古代文学批判中,还常常见到称赞某人为榜首、某诗为榜首的。如《宋书·谢灵运传》说谢灵运“文章之美,与颜延之为江左榜首”。宋人许顗《彦周诗话》说“孟浩然、王摩诘诗,自李杜而下,当为榜首”。
不过,古人的诗学批判,无论是分品第,仍是排座次,都是根据个人的片面好恶。因为每个人的审美趣尚不同,所以对同一个人、同一首著作,谈论往往不一样。比方,金人元好问、赵秉文和王若虚都推许东坡词“起衰振靡,当为古今榜首”,清代潘德舆却叫板不认同,以为“推奉过分”。
现代计量前史学能够用数据衡量前史,古代文学也归于大前史的领域。已然前史能够计量,为什么文学不能计量?经过大数据,能够找到一个最大公约数,用模型来剖析和衡定,得出相对客观的答案。
中新社记者:您的十大唐诗、宋词、诗人、词人排行榜怎么得出?从大数据看,唐诗宋词里谁的著作最多?著作量多的诗人词人,是否影响力大、知名度高?
王兆鹏:咱们根据诗篇在历代选本中的当选频次、被历代诗论家谈论的频次、被后人追和的频次和今世学者研讨的频次、被网页著录及谈论的频次等数据加权核算,确认一首诗的影响力,并将影响力位居前列的视为名篇。
现在已无法直接调查出在古代李白、杜甫的诗集有多少种、印数有多大,但能够核算杜甫和李白的诗集别离被刊刻了多少种。据此计算,在宋代,杜甫的影响力比李白大得多,有一种说法叫千家注杜,杜诗韩文是一切读书人的模范。
数据显现,唐代诗人归纳影响力排名榜首的是杜甫,其次为李白、王维。著作量榜首的白居易,影响力排在十名之外。而宋词影响力位居榜首的是辛弃疾,苏轼、周邦彦别离居第二、第三。
影响力大的诗人,具有名篇也多。一百首唐诗名篇,杜甫独占16首,李白13首,王维和白居易均享12首。在三百首唐诗名篇中,杜甫豪取52首,占六分之一,李白有38首,王维和白居易共29首。在宋词百首名篇中,周邦彦夺得15首,辛弃疾获12首,苏轼10首,姜夔7首。扩展到三百首宋词名篇,周邦彦斩获40首,辛弃疾和苏轼各占23首,姜夔11首。宋诗百首名篇,苏轼一人占四分之一,比杜甫在唐诗中的名篇具有率还高。
故宫博物院藏苏轼主题书画特展。中新社记者 杜洋 摄
中新社记者:诗人张若虚以一首《春江花月夜》“孤篇盖全唐”,但他只要两首诗撒播下来。关于这样的诗人,能用大数据剖析吗?未来会可否用大数据剖析外国诗篇?
王兆鹏:现在咱们了解的陈子昂的《登幽州台歌》,以及张若虚的《春江花月夜》,其影响力是到20世纪之后才逐步变大。《春江花月夜》在明清并无影响力,直到王闿运赞其“孤篇横绝,竟为咱们”,闻一多又称其为“诗中的诗,高峰中的高峰”,才将这首诗抬到登峰造极的位置。
相同状况还有陆游的《卜算子·咏梅》(驿外断桥边)。毛泽东曾用“风雨送春归,飞雪迎春到”来和陆游这首词,一代伟人和首领以本身政治影响力和诗词位置,提高了这首词的影响力。柳永《蝶恋花》(伫倚危楼风细细),在明清之前也简直没有什么影响力,但自从王国维将“衣带渐宽终不悔,为伊消得人憔悴”列为人生三种境地后,这首词开端被读者熟知。
杜甫在盛唐年代简直是一个无名小卒。李白知名时,杜甫仅仅一个一般的文艺青年。他和李白的年纪相差11岁,是李白的“迷弟”,所以能够看到许多杜甫思念李白的诗,但很少看到李白给杜甫的诗。杜甫逝世许多年后,元稹为其写墓志铭时发现了他的光辉。后来韩愈在《调张籍》中说“李杜文章在,光焰万丈长”,文坛首领的引荐又进一步扩展了杜甫的影响力。
话剧《杜甫》。中新社发 史春阳 摄
有些诗人、词人,在外国的影响力或许比在我国高。寒山的诗曾经在美国风靡一时,在国内反倒没多少人了解他。在西方,著作被翻译最多的我国诗人不是李白、杜甫,而是王维;著作被翻译最多的词人不是辛弃疾、苏轼,而是李清照。
文学的开展有必定的偶尔要素,比方李清照的著作在宋代有许多种版别,用今日的话来说,宋代许多出书社出书了她的词集,但到了明代悉数失传。她的著作只能去选本中找,终究只找到40多首。别的,与李清照同时期的女词人朱淑真,在其时的影响力并不大,但她的几百首著作反而悉数撒播了下来。
也有许多古代红极一时的诗词,今日却无人问津。如欧阳修《蝶恋花》(海燕双来归画栋)、聂冠卿《多丽》(想人生)、周邦彦《侧犯》(暮霞霁雨)、王观《雨中花令》(百尺清泉声连续),它们别离在明代22种词选中被当选17、18、19、20词,差不多是明人词选必选的名篇。可到了20世纪,其影响力和知名度降到了最低。个中原因,值得考虑与讨论。
古诗词的影响力一直处于不断改变之中,很难经过一两条资料得出全面、客观、精确的判别,而大数据能够完好展现出一首诗词影响力的改变。
我从1992年榜首次用数据剖析古代诗词,现在数据不断丰厚,模型不断完善。2000年今后,大数据库中除了我国不同前史时期的古诗词选本,还纳入了欧美日韩等海外的我国古代诗词数据。
现在,咱们正建造古今中外诗篇的交融大数据渠道。该渠道现已搜集了上百万首我国古典诗篇,正在搜集20世纪以来有中文翻译的外国诗篇,以及五四运动以来的十余万首新诗。
没有一个大数据能够尽头样本,但咱们期望凭借人工智能得出差错最小的定论。五四运动后的诗人郭沫若、胡适、闻一多,谁的影响力更大?在我国影响力最大的外国诗人是普希金、泰戈尔仍是歌德?咱们将用大数据说话。(完)
受访者简介:
王兆鹏。中新社记者 安源 摄
王兆鹏,四川大学文学与新闻学院文科讲席教授、博士生导师。现为我国词学研讨会会长、我国李清照辛弃疾学会会长、我国宋代文学学会常务副会长,《宋代文学研讨年鉴》主编。首要研讨唐宋文学和数字人文,掌管国家社会科学基金重大项目2项。已出书《全唐五代词》《唐宋词史论》《词学史料学》等专著十余部,宣布学术论文三百余篇。