文學(xué)批評(píng)用數(shù)據(jù)“說話”的可能性
10年前,《紐約時(shí)報(bào)》刊文描述了大數(shù)據(jù)技術(shù)對(duì)社會(huì)生活諸多方面的影響,認(rèn)為“大數(shù)據(jù)時(shí)代”已經(jīng)來臨,但并沒有引發(fā)大規(guī)模討論和預(yù)想的轟動(dòng)效應(yīng),回應(yīng)者寥寥無幾。這種平靜表明人們已經(jīng)適應(yīng)和融入了大數(shù)據(jù)生活,不再感覺陌生和驚奇?!按髷?shù)據(jù)”已經(jīng)從一個(gè)全新的學(xué)理概念、政策制度和發(fā)展戰(zhàn)略,轉(zhuǎn)變?yōu)榇_定的生活常識(shí)。在全新的時(shí)代語境中,大數(shù)據(jù)技術(shù)也改變了文學(xué)創(chuàng)作,產(chǎn)生了文學(xué)新樣態(tài)及其相關(guān)數(shù)據(jù)。例如,游戲文學(xué)、界面文學(xué)和賽博格文學(xué)等。這些文學(xué)的寫作主體、敘述內(nèi)容、審美原則、傳播機(jī)制和讀者接受都發(fā)生了革新??梢哉f,大數(shù)據(jù)技術(shù)對(duì)文學(xué)生態(tài)產(chǎn)生了顛覆式影響。
利用計(jì)算機(jī)技術(shù),以量化統(tǒng)計(jì)的方式研究文學(xué),是否行得通
為了應(yīng)對(duì)這些新變,文學(xué)批評(píng)需要及時(shí)調(diào)整批評(píng)方法。這也是文學(xué)批評(píng)的技術(shù)化轉(zhuǎn)向和文學(xué)計(jì)算興起的重要原因之一。傳統(tǒng)意義上,“文學(xué)數(shù)據(jù)”是指文學(xué)作品和文學(xué)研究文獻(xiàn)電子化后產(chǎn)生的數(shù)據(jù),具有體量小、易分析和好管理等特征,集中體現(xiàn)為各種類型的文學(xué)數(shù)據(jù)庫和文學(xué)研究數(shù)據(jù)庫。例如,魯迅文學(xué)作品及其研究資料電子化后形成的魯迅文學(xué)數(shù)據(jù)庫和魯迅研究數(shù)據(jù)庫。
而“文學(xué)大數(shù)據(jù)”是指文學(xué)作品和文學(xué)研究文獻(xiàn)在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)傳播過程中產(chǎn)生的文學(xué)數(shù)據(jù),具有體量大、動(dòng)態(tài)化、類型多、提取難、價(jià)值密度低和不易管理等特征。例如,一部文學(xué)作品在微信、微博等社交網(wǎng)絡(luò)傳播后,會(huì)產(chǎn)生關(guān)于此作品的海量評(píng)價(jià),除了文字評(píng)價(jià),還包括圖片、音樂、鏈接、表情包、彈幕、點(diǎn)贊等多種數(shù)據(jù)。分析這些大數(shù)據(jù),可以獲取讀者的年齡、職業(yè)和地域,文學(xué)作品表達(dá)的思想情感是否與社會(huì)提倡的價(jià)值觀念相吻合,此部文學(xué)作品講述的故事與哪些中外文學(xué)作品相似,讀者是否喜歡這類文學(xué)作品等諸多內(nèi)容。這些海量數(shù)據(jù)的整理和分析單純依靠人工難以完成,需要相關(guān)計(jì)算技術(shù)的支撐。因此,文學(xué)計(jì)算應(yīng)運(yùn)而生。
簡(jiǎn)單而言,文學(xué)計(jì)算是指利用計(jì)算機(jī)技術(shù),以量化統(tǒng)計(jì)的方式研究文學(xué),具有明顯的跨學(xué)科性。文學(xué)計(jì)算在古代文學(xué)研究中應(yīng)用較為廣泛,尤其在唐詩和明清小說研究方面發(fā)力較深,涉及版本考證、作者辨?zhèn)魏腿宋锕δ芊治龅榷鄠€(gè)領(lǐng)域。例如,20世紀(jì)80年代陳大康、錢峰等人曾提出文學(xué)研究與計(jì)算機(jī)科學(xué)相結(jié)合的觀念,并以量化統(tǒng)計(jì)方法研究《紅樓夢(mèng)》。通過統(tǒng)計(jì)詞頻、詞長(zhǎng)和段落長(zhǎng)度變化,考證《紅樓夢(mèng)》作者,分析審美特征等。但受制于計(jì)算技術(shù),只分析了《紅樓夢(mèng)》一部作品。直至新世紀(jì),隨著計(jì)算技術(shù)和通信技術(shù)的快速發(fā)展,以及文學(xué)計(jì)算理論的普及,文學(xué)計(jì)算才大范圍崛起。劉石、趙薇、王賀等一批學(xué)者深耕此領(lǐng)域,取得了開創(chuàng)性成果,推動(dòng)了國(guó)內(nèi)文學(xué)計(jì)算的發(fā)展。
大數(shù)據(jù)介入文學(xué)批評(píng),可能帶來思維上的變革
文學(xué)計(jì)算不僅是批評(píng)方法的轉(zhuǎn)向,而且是批評(píng)思維的變革。首先,從主觀理論建構(gòu)到客觀數(shù)據(jù)實(shí)證。一般意義上,文學(xué)批評(píng)注重文學(xué)理論和審美建構(gòu),闡釋對(duì)象以單篇或同一類型的文學(xué)作品為主。帶有很強(qiáng)的個(gè)人主觀性,難免形成視域盲區(qū),理論的有效性經(jīng)常受到質(zhì)疑。例如,文學(xué)批評(píng)在建構(gòu)現(xiàn)實(shí)主義文學(xué)理論時(shí),經(jīng)常以巴爾扎克的《人間喜劇》、托爾斯泰的《戰(zhàn)爭(zhēng)與和平》等作品為例。以此得出的觀點(diǎn)可以適用西方19世紀(jì)現(xiàn)實(shí)主義文學(xué),但對(duì)中國(guó)現(xiàn)實(shí)主義文學(xué)不一定適用?;蛘哒f,文學(xué)批評(píng)的理論和審美建構(gòu)因缺乏大規(guī)模文學(xué)作品的支撐,提出的觀點(diǎn)只契合小部分作品,無法真正構(gòu)建普遍適用于“世界文學(xué)”的理論。
計(jì)算技術(shù)提升了整理和分析大規(guī)模文學(xué)作品的能力。谷歌圖書在2010年已經(jīng)收集了全球1.3億冊(cè)圖書數(shù)據(jù),而且每年都在成倍增長(zhǎng)。因而,文學(xué)批評(píng)不再局限于小部分文學(xué)作品分析,可以把批評(píng)對(duì)象延伸到世界文學(xué)作品,讓全球文學(xué)數(shù)據(jù)自己“說話”。在此基礎(chǔ)上,可以得出更為客觀和普遍有效的結(jié)論。
其次,從確證因果關(guān)系到呈現(xiàn)相關(guān)關(guān)系。確證因果關(guān)系是指批評(píng)者通過分析文學(xué)作品,證實(shí)文學(xué)作品與具體歷史和現(xiàn)實(shí)事件之間的因果聯(lián)系。這種批評(píng)思維對(duì)小部分文學(xué)作品有效,但面對(duì)大規(guī)模的文學(xué)作品則難以實(shí)踐。例如,文學(xué)批評(píng)在闡釋20世紀(jì)30年代鄉(xiāng)土小說時(shí),致力于確證鄉(xiāng)土小說與日本侵華戰(zhàn)爭(zhēng)的因果關(guān)系。因此,解讀的重心就放在鄉(xiāng)土小說反抗日本殖民統(tǒng)治和表現(xiàn)強(qiáng)烈民族意識(shí)上。這種批評(píng)思維可以適用于蕭紅的《生死場(chǎng)》和蕭軍的《八月的鄉(xiāng)村》,卻無法用來解讀同時(shí)期沈從文的《邊城》和師陀的《果園城記》等作品。
而文學(xué)相關(guān)關(guān)系是指文學(xué)作品與歷史和現(xiàn)實(shí)事件之間的數(shù)值關(guān)系。當(dāng)一部文學(xué)作品數(shù)值增加時(shí),相關(guān)歷史社會(huì)和現(xiàn)實(shí)事件也隨之增加,意味著它們之間的相關(guān)關(guān)系強(qiáng),反之則亦然。例如,在互聯(lián)網(wǎng)搜索“鄉(xiāng)土小說”時(shí),出現(xiàn)的信息既包括魯迅、彭家煌等作家作品,又包括五四運(yùn)動(dòng)、封建專制文化等歷史事件和背景。當(dāng)這些作家作品和歷史事件共同且持續(xù)出現(xiàn)在不同的“鄉(xiāng)土小說”詞條中時(shí),它們之間的相關(guān)關(guān)系就強(qiáng)。也就是說,文學(xué)計(jì)算不再需要主觀確證文學(xué)與歷史和現(xiàn)實(shí)之間的因果聯(lián)系,只需通過分析文學(xué)數(shù)據(jù)之間的相關(guān)關(guān)系,就可以客觀呈現(xiàn)這種因果聯(lián)系,相對(duì)更客觀和不受主觀偏見的影響。
再次,從單向度的文學(xué)思維轉(zhuǎn)向多維度的跨文學(xué)思維。本質(zhì)上,文學(xué)批評(píng)始終在追問“文學(xué)是什么”的問題?;卮鸬慕嵌?、邏輯和結(jié)論都與文學(xué)的審美性和精神性相關(guān)。但這也忽略了文學(xué)之外的眾多因素。出現(xiàn)這種狀況的重要原因之一是在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)興起之前,沒有出現(xiàn)真正的文學(xué)大數(shù)據(jù)和缺乏分析文學(xué)大數(shù)據(jù)的工具。隨著這一困境的解決,非文學(xué)數(shù)據(jù)也可以參與回答“文學(xué)是什么”的問題。這樣,就可以突破文學(xué)的邊界,進(jìn)入自然科學(xué)、社會(huì)科學(xué)和藝術(shù)學(xué)等其他領(lǐng)域來重新界定文學(xué)及其相關(guān)知識(shí),構(gòu)建新的文學(xué)批評(píng)闡釋框架和理論基礎(chǔ),重建學(xué)科體系、學(xué)術(shù)體系和話語體系。
例如,文學(xué)批評(píng)可以借助神經(jīng)科學(xué)分析人物情感,利用數(shù)學(xué)建模分析人物社會(huì)網(wǎng)絡(luò),運(yùn)用自然語言科學(xué)分析文學(xué)敘述語言審美特性等。以此為研究者提供多維度、差異化的研究視角和材料,拓展文學(xué)批評(píng)邊界,提升重釋文學(xué)的能力。同樣,文學(xué)也可以進(jìn)入其他學(xué)科,以自身獨(dú)特的人文性為其他學(xué)科注入精神和審美因素,實(shí)現(xiàn)文學(xué)批評(píng)的跨學(xué)科發(fā)展。
力求有效調(diào)和“人文文化”與“科學(xué)文化”之間的矛盾關(guān)系
文學(xué)批評(píng)的技術(shù)化有諸多優(yōu)勢(shì),但也存在需要調(diào)整和修正的局限。文學(xué)計(jì)算的基本原理是依據(jù)計(jì)算模型分析文學(xué)數(shù)據(jù)是否符合計(jì)算規(guī)則,但無法判斷數(shù)據(jù)的真假和分析其中蘊(yùn)含的主觀觀念?;蛘哒f,文學(xué)計(jì)算只負(fù)責(zé)回答與規(guī)則對(duì)應(yīng)的文學(xué)數(shù)據(jù)“怎么樣”的問題,而無法闡述“為什么”的問題。例如,文學(xué)計(jì)算可以統(tǒng)計(jì)出在20世紀(jì)40年代有哪些作家到過上海、寫了哪些文學(xué)作品,并以可視地圖方式呈現(xiàn)出現(xiàn),卻無法回答為什么這些作家作品會(huì)在這個(gè)時(shí)間集中出現(xiàn)在上海,與上海有何種關(guān)系等問題。這樣就需要批評(píng)主體憑借自身的主觀智能找出其中的原因。
文學(xué)計(jì)算指涉的對(duì)象是文學(xué)數(shù)據(jù),而非文學(xué)數(shù)據(jù)背后的精神意義。例如,文學(xué)計(jì)算可以統(tǒng)計(jì)魯迅《秋夜》中有兩棵棗樹,但無法呈現(xiàn)兩顆棗樹蘊(yùn)含的孤獨(dú)體驗(yàn)。這也是文學(xué)計(jì)算備受詬病的致命缺陷。因此需要批評(píng)主體賦予文學(xué)數(shù)據(jù)以價(jià)值導(dǎo)向和精神內(nèi)涵。
文學(xué)計(jì)算始終秉持“非此即彼”的極化思維。符合規(guī)則的為“是”,反之為“否”,排除了規(guī)則之外的中間化和模糊化的文學(xué)數(shù)據(jù),使文學(xué)批評(píng)滑向判斷文學(xué)數(shù)據(jù)“真”和“假”的游戲。例如,如果文學(xué)計(jì)算設(shè)置“犧牲”為判定革命英雄人物的規(guī)則,那么符合此規(guī)則的為“是”,反之為“否”。但這一規(guī)則無法判定《風(fēng)聲》等諜戰(zhàn)小說中類似阿炳這樣憑借特異天賦成為革命英雄的人物。
文學(xué)計(jì)算以文學(xué)數(shù)據(jù)的最大公約數(shù)為依據(jù)闡釋文學(xué)。但文學(xué)本身就是建立在個(gè)體對(duì)現(xiàn)實(shí)差異化理解和表述基礎(chǔ)上,充滿了變動(dòng)和偶然,這也是文學(xué)的重要魅力。因此,正如學(xué)者張福貴所說,文學(xué)計(jì)算能否“從歷史的長(zhǎng)線來對(duì)文學(xué)史現(xiàn)象和作家作品做出相對(duì)超越性的評(píng)價(jià),是存有疑問和不無難度的”。
雖然文學(xué)批評(píng)的技術(shù)化轉(zhuǎn)向存在諸多問題,但這不是我們否認(rèn)它的理由,應(yīng)該辯證看待這種轉(zhuǎn)向,既要汲取它的合理性,也要尋找解決問題的路徑。事實(shí)上,這些問題都是“人文文化”與“科學(xué)文化”矛盾關(guān)系的體現(xiàn)。從20世紀(jì)五六十年代提出人文與科學(xué)沖突的命題至今,這種二元對(duì)立思維始終沒能有效調(diào)和。關(guān)于文學(xué)批評(píng)技術(shù)化的爭(zhēng)議也多與此有關(guān)。如果我們能擺脫這種極化思維,以文學(xué)大數(shù)據(jù)和文學(xué)計(jì)算作為驗(yàn)證文學(xué)人文思想的基礎(chǔ)和方法,以人文思想豐富文學(xué)大數(shù)據(jù)和文學(xué)計(jì)算的精神價(jià)值,實(shí)現(xiàn)二者的對(duì)話和融通,那么文學(xué)批評(píng)技術(shù)化轉(zhuǎn)向就有無限美好的未來。
(作者:楊丹丹,系河南師范大學(xué)文學(xué)院副教授,本文系國(guó)家社會(huì)科學(xué)基金項(xiàng)目“人工智能寫作本體研究”〔20BZW175〕階段性研究成果)