用戶(hù)登錄投稿

中國(guó)作家協(xié)會(huì)主管

文學(xué)大數(shù)據(jù)與當(dāng)代文學(xué)研究范式轉(zhuǎn)型
來(lái)源:《當(dāng)代作家評(píng)論》 |  楊丹丹  2022年02月23日08:17

中國(guó)當(dāng)代文學(xué)研究范式轉(zhuǎn)型是一個(gè)常談常新的話(huà)題。從當(dāng)代文學(xué)發(fā)生之日起,學(xué)術(shù)界就面臨如何闡釋當(dāng)代文學(xué)的問(wèn)題,其中就涉及文學(xué)研究的方法和范式等內(nèi)容。而且,隨著文學(xué)社會(huì)語(yǔ)境、研究對(duì)象和訴求的變化,文學(xué)研究范式轉(zhuǎn)型問(wèn)題也越發(fā)突出和明顯,通常顯現(xiàn)在文學(xué)研究方法論爭(zhēng)中,通過(guò)論爭(zhēng)確立某一歷史階段通約有效的研究方法,并在長(zhǎng)期實(shí)踐中形成主流文學(xué)研究范式。從這一角度看,當(dāng)代文學(xué)研究范式轉(zhuǎn)型與當(dāng)代文學(xué)演進(jìn)和當(dāng)代文學(xué)研究史變遷緊密關(guān)聯(lián)。

當(dāng)代文學(xué)與古代文學(xué)、近現(xiàn)代文學(xué)的本質(zhì)差異之一是它的“當(dāng)代”屬性?!爱?dāng)代”的繁復(fù)多變和時(shí)刻在場(chǎng),使當(dāng)代文學(xué)研究需要直面最新的文學(xué)現(xiàn)場(chǎng),成為“當(dāng)前文學(xué)思潮、作品和現(xiàn)象最‘理想’的‘批評(píng)者’”,并運(yùn)用“認(rèn)同式”“討論式”批評(píng)(1)契合當(dāng)代文學(xué)的“當(dāng)代性”。這預(yù)設(shè)了當(dāng)代文學(xué)研究范式的不穩(wěn)定,沒(méi)有任何一種長(zhǎng)久不變的研究范式能夠有效應(yīng)對(duì)不斷新變的文學(xué)現(xiàn)場(chǎng)。這也使當(dāng)代文學(xué)研究顯現(xiàn)出強(qiáng)烈的危機(jī)感。當(dāng)無(wú)法“對(duì)嶄新的文學(xué)實(shí)踐做出辨認(rèn)、預(yù)判,疾言厲色或?yàn)橹呐c呼”時(shí),(2)勢(shì)必對(duì)已有研究范式做出修正和調(diào)整,甚至進(jìn)行顛覆和重構(gòu),尋找新的研究范式替代。只有如此,才能保證文學(xué)研究的有效闡釋力和公信力。因此,當(dāng)代文學(xué)研究本身就包含對(duì)自身轉(zhuǎn)型問(wèn)題的持續(xù)探索。

從中國(guó)當(dāng)代文學(xué)研究史來(lái)看,大體形成了文學(xué)政治研究、文學(xué)審美研究、文學(xué)文化研究和文學(xué)社會(huì)研究幾種主流研究范式。它們與特定歷史語(yǔ)境和時(shí)代訴求密切相關(guān)。大致對(duì)應(yīng)20世紀(jì)50—70年代、80年代、90年代和2000年以來(lái)幾個(gè)歷史階段。每種研究范式在相應(yīng)的歷史階段都具有優(yōu)先于其他研究范式的闡釋權(quán)且處于流轉(zhuǎn)狀態(tài)。這說(shuō)明任何一種文學(xué)研究范式都有其邊界和限度,當(dāng)新的社會(huì)語(yǔ)境、新的文學(xué)現(xiàn)象出現(xiàn)時(shí),必然產(chǎn)生新的研究范式?;蛘哒f(shuō),文學(xué)研究范式轉(zhuǎn)型問(wèn)題是當(dāng)代文學(xué)研究史自身生發(fā)的問(wèn)題,一種新的文學(xué)研究范式的形成過(guò)程也是其他文學(xué)研究范式的式微過(guò)程??梢哉f(shuō),“學(xué)術(shù)范式的轉(zhuǎn)換和形成是一個(gè)相當(dāng)復(fù)雜的過(guò)程,一方面出自社會(huì)文化轉(zhuǎn)型的需要,另方面有學(xué)術(shù)本身的發(fā)展特點(diǎn)”。(3)

因此,想辨識(shí)清楚當(dāng)代文學(xué)研究范式轉(zhuǎn)型問(wèn)題,就需要闡明與此相關(guān)的文學(xué)新語(yǔ)境和新現(xiàn)象,以及原有文學(xué)研究范式的限度和新的文學(xué)研究范式的適用性問(wèn)題。在此意義上,我們需要解釋清楚文學(xué)研究在當(dāng)下發(fā)生了怎樣的新變化,文學(xué)研究方法和思維發(fā)生了怎樣的新轉(zhuǎn)變,出現(xiàn)了哪些新的文學(xué)研究實(shí)踐路徑,生產(chǎn)了哪些新知識(shí)等問(wèn)題。

一、大數(shù)據(jù)時(shí)代與文學(xué)大數(shù)據(jù)

1980年,美國(guó)社會(huì)學(xué)家阿爾文·托夫勒在著作《第三次浪潮》中闡述了科技發(fā)展在農(nóng)業(yè)社會(huì)到工業(yè)社會(huì)轉(zhuǎn)型過(guò)程中起到的關(guān)鍵作用,并且預(yù)測(cè)電子科技進(jìn)步將引發(fā)“第三次浪潮文明”:人類(lèi)將由工業(yè)社會(huì)進(jìn)入信息社會(huì),“整個(gè)文明和制度、技術(shù)、文化都在變化的浪潮下日趨分裂”。(4)尤其是大數(shù)據(jù)技術(shù)在日常生活諸多方面的廣泛應(yīng)用,將推動(dòng)大數(shù)據(jù)社會(huì)的形成。當(dāng)下,隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)的快速發(fā)展,阿爾文·托夫勒的預(yù)測(cè)開(kāi)始變?yōu)楝F(xiàn)實(shí),“根據(jù)國(guó)際權(quán)威機(jī)構(gòu)Statista的統(tǒng)計(jì)和預(yù)測(cè),2020年全球數(shù)據(jù)產(chǎn)生量預(yù)計(jì)達(dá)到47ZB,而到2035年,這一數(shù)字將達(dá)到2142ZB,全球數(shù)據(jù)量即將迎來(lái)更大規(guī)模的爆發(fā)”。(5)

事實(shí)上,系統(tǒng)認(rèn)識(shí)和理解大數(shù)據(jù)最先從學(xué)術(shù)界開(kāi)始?!蹲匀弧贰犊茖W(xué)》《ERCIM News》等業(yè)界頂尖期刊都曾開(kāi)設(shè)“大數(shù)據(jù)專(zhuān)輯”,對(duì)數(shù)據(jù)的維護(hù)、再利用,數(shù)據(jù)的可解釋性和數(shù)據(jù)處理主體等問(wèn)題進(jìn)行探討。雖然,學(xué)術(shù)界的討論主要集中在學(xué)理層面,但都表明一個(gè)事實(shí):大數(shù)據(jù)可能成為引領(lǐng)未來(lái)社會(huì)發(fā)展的支配性力量。而且,隨著大數(shù)據(jù)理論的不斷成熟,大數(shù)據(jù)討論開(kāi)始溢出學(xué)理層面,轉(zhuǎn)而在社會(huì)實(shí)踐應(yīng)用維度發(fā)力,進(jìn)而上升為國(guó)家發(fā)展戰(zhàn)略。中國(guó)、美國(guó)和歐盟等國(guó)家/地區(qū)紛紛制定了大數(shù)據(jù)發(fā)展政策。中國(guó)早在2014年就將“大數(shù)據(jù)”寫(xiě)入政府工作報(bào)告,明確實(shí)施國(guó)家大數(shù)據(jù)戰(zhàn)略。更為重要的是,“一場(chǎng)由大數(shù)據(jù)帶來(lái)的技術(shù)革命”和“智能革命”(6)開(kāi)始重塑現(xiàn)實(shí)世界,滲入日常生活的各個(gè)角落,“從商業(yè)科技到醫(yī)療、政府、教育、經(jīng)濟(jì)、人文以及社會(huì)的其他各個(gè)領(lǐng)域”(7)都有大數(shù)據(jù)的魅影。人們可以直接感受到自己生活在一個(gè)被數(shù)字編織的數(shù)據(jù)網(wǎng)中。那么,在大數(shù)據(jù)時(shí)代,數(shù)據(jù)技術(shù)是如何改變文學(xué)的?產(chǎn)生的文學(xué)大數(shù)據(jù)呈現(xiàn)出哪些新的特征?文學(xué)研究方法出現(xiàn)哪些變化?

回答上述問(wèn)題的前提是首先明確“文學(xué)大數(shù)據(jù)”的概念。目前為止,學(xué)術(shù)界對(duì)“大數(shù)據(jù)”的概念仍存在較大分歧,麥肯錫、維克托·邁爾·舍恩伯格和肯尼思·庫(kù)克耶等學(xué)者都曾界定過(guò)大數(shù)據(jù),但都沒(méi)有形成共識(shí)。(8)所以,筆者只能從現(xiàn)有概念中提取大數(shù)據(jù)的一些基本特征:數(shù)據(jù)規(guī)模大,數(shù)據(jù)來(lái)源、種類(lèi)多,數(shù)據(jù)增長(zhǎng)、處理速度快,數(shù)據(jù)價(jià)值密度低等。(9)這些特征決定了大數(shù)據(jù)的“大”不僅是數(shù)據(jù)數(shù)量的大,更是指數(shù)據(jù)的復(fù)雜多變,以及通過(guò)數(shù)據(jù)獲取新知識(shí)的能力。以此為標(biāo)準(zhǔn),可以為“文學(xué)大數(shù)據(jù)”暫時(shí)確立一個(gè)相對(duì)穩(wěn)固的概念:文學(xué)大數(shù)據(jù)與傳統(tǒng)意義上的文學(xué)數(shù)據(jù)不同,不是指文學(xué)作品和文學(xué)文獻(xiàn)電子化后產(chǎn)生的電子文本數(shù)據(jù),而是指文學(xué)作品在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)傳播過(guò)程中產(chǎn)生的與文學(xué)相關(guān)的數(shù)據(jù),包括日志、音頻、視頻、圖片、彈幕、點(diǎn)贊等結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化多種類(lèi)型數(shù)據(jù)。這些數(shù)據(jù)數(shù)量巨大,來(lái)源、種類(lèi)多樣,成碎片化分布,且處于實(shí)時(shí)更新?tīng)顟B(tài),有價(jià)值和可利用的數(shù)據(jù)密度較低,需要利用計(jì)算技術(shù)分析這些數(shù)據(jù)。例如,余華的小說(shuō)《文城》出版后,在微信、微博等社交媒體和豆瓣讀書(shū)、京東圖書(shū)等網(wǎng)絡(luò)購(gòu)書(shū)平臺(tái),以及抖音、快手等短視頻媒體中迅速傳播,產(chǎn)生了數(shù)量龐大的文學(xué)數(shù)據(jù),包括讀者截取的小說(shuō)原文段落、長(zhǎng)篇專(zhuān)業(yè)評(píng)論、簡(jiǎn)短的即時(shí)感受文字、表達(dá)閱讀情緒的圖片、講述閱讀體會(huì)的視頻、購(gòu)書(shū)推薦評(píng)語(yǔ)、銷(xiāo)售數(shù)字表格、小說(shuō)影響力排行表和小說(shuō)的知識(shí)圖譜等。從這些數(shù)據(jù)中可以分析出讀者對(duì)小說(shuō)的總體評(píng)價(jià)、專(zhuān)業(yè)批評(píng)家與普通讀者的接受差異、讀者的地理信息、小說(shuō)在不同地域的文化影響力、當(dāng)下社會(huì)情緒的走勢(shì)、讀者的審美變化和小說(shuō)的未來(lái)發(fā)展趨勢(shì)等內(nèi)容。而且,不同類(lèi)型數(shù)據(jù)之間的重組又可以產(chǎn)生新數(shù)據(jù)。可以說(shuō),當(dāng)《文城》進(jìn)入互聯(lián)網(wǎng)和社交網(wǎng)被數(shù)據(jù)化之后,就不再是一部單純的文學(xué)作品,轉(zhuǎn)而成為生產(chǎn)文學(xué)數(shù)據(jù)及其相關(guān)新知識(shí)的載體。

文學(xué)大數(shù)據(jù)既是紙媒文學(xué)在互聯(lián)網(wǎng)和社交網(wǎng)傳播的結(jié)果,又是依托網(wǎng)絡(luò)、利用數(shù)字技術(shù)生產(chǎn)數(shù)字化文學(xué)的產(chǎn)物。這些“數(shù)字文學(xué)”(10)在利用文學(xué)大數(shù)據(jù)的同時(shí),又再次產(chǎn)生了文學(xué)大數(shù)據(jù)。人工智能文學(xué)、超文本文學(xué)、視覺(jué)文學(xué)和界面文學(xué)等“數(shù)字文學(xué)”的誕生不僅是新舊文學(xué)形態(tài)的更迭,而且是文學(xué)寫(xiě)作生態(tài)的全方位變革。它的“非線(xiàn)性敘事、非穩(wěn)定結(jié)構(gòu)、讀者參與性以及多媒體特征被視為對(duì)傳統(tǒng)文學(xué)理論以及文學(xué)審美的挑戰(zhàn)”,同時(shí),其特有的“編程功能、數(shù)字代碼、計(jì)算機(jī)算法等數(shù)字文學(xué)內(nèi)部運(yùn)行機(jī)制被視為新美學(xué)基礎(chǔ)和美學(xué)特征”。(11)可以說(shuō),這些新的文學(xué)特性都與文學(xué)大數(shù)據(jù)緊密關(guān)聯(lián)。例如,超文本文學(xué)就超越了傳統(tǒng)語(yǔ)義文本的限制,把詞語(yǔ)、地理位置和個(gè)體信息等眾多主題元素按照多種組合方式重組,甚至“任何可以看見(jiàn)、可以聽(tīng)見(jiàn)的都可以構(gòu)成文本的紋理”。(12)而且,寫(xiě)作主體既可以是人,也可以是智能機(jī)器。進(jìn)一步而言,超文本形成的基礎(chǔ)是文學(xué)大數(shù)據(jù),通過(guò)分析和管理文學(xué)大數(shù)據(jù),把文學(xué)大數(shù)據(jù)存儲(chǔ)在各個(gè)文字節(jié)點(diǎn)上。然后,在這些文字節(jié)點(diǎn)之間確立相關(guān)關(guān)系,再以鏈接的方式把各個(gè)文字節(jié)點(diǎn)串聯(lián)起來(lái),形成一種網(wǎng)狀結(jié)構(gòu)。同時(shí),超文本在互聯(lián)網(wǎng)和社交網(wǎng)傳播過(guò)程又生產(chǎn)了新的文學(xué)數(shù)據(jù),并無(wú)限循環(huán)往復(fù)。林焱的小說(shuō)《白毛女在1971》就是一部典型的超文本小說(shuō),作家在文本中設(shè)置了多個(gè)鏈接符號(hào),這些鏈接符號(hào)與故事情節(jié)敘述密切相關(guān),讀者只有閱讀完這些鏈接網(wǎng)頁(yè)的內(nèi)容后,才能繼續(xù)閱讀小說(shuō)剩余的內(nèi)容。(13)

對(duì)當(dāng)代文學(xué)研究而言,面對(duì)文學(xué)大數(shù)據(jù)及新的文學(xué)樣態(tài),需要認(rèn)真思考如何調(diào)整和重塑文學(xué)研究方法,與此新變相契合,進(jìn)而建構(gòu)新的研究范式。因此,“如何在設(shè)計(jì)算法、挖掘工具、可視化工具及存檔技術(shù)時(shí)凸顯價(jià)值、解釋和意義變得更加重要”。(14)

二、文學(xué)數(shù)據(jù)研究中“小數(shù)據(jù)”與“大數(shù)據(jù)”

為了應(yīng)對(duì)文學(xué)的數(shù)字化和數(shù)據(jù)化,文學(xué)研究引入了“計(jì)算”方法,把信息技術(shù)和計(jì)算機(jī)技術(shù)應(yīng)用到文學(xué)研究。文學(xué)計(jì)算的兩大核心是:文學(xué)數(shù)據(jù)和計(jì)算技術(shù)。尤其是計(jì)算技術(shù)至關(guān)重要,它決定了文學(xué)數(shù)據(jù)研究的上限。因?yàn)?,文學(xué)數(shù)據(jù)研究“具有高度技術(shù)化的內(nèi)涵與本質(zhì),它必須依托數(shù)字系統(tǒng)建設(shè)、程序代碼編寫(xiě)或者其他手段來(lái)實(shí)現(xiàn)研究過(guò)程或呈現(xiàn)研究結(jié)果”。(15)現(xiàn)階段,這些計(jì)算技術(shù)包括可視化與數(shù)據(jù)設(shè)計(jì)技術(shù),文本分析、聚合與數(shù)據(jù)挖掘技術(shù),地理信息系統(tǒng)技術(shù)和仿真技術(shù)等,這些技術(shù)的大規(guī)模開(kāi)發(fā)和普遍應(yīng)用推進(jìn)了文學(xué)數(shù)據(jù)研究的深入發(fā)展。這也可以解釋為何在文學(xué)數(shù)據(jù)研究初期,大部分研究只能停留在單體文本詞語(yǔ)抽取、詞頻統(tǒng)計(jì)和語(yǔ)法分析上。因?yàn)槲膶W(xué)數(shù)據(jù)量不夠,計(jì)算技術(shù)不先進(jìn),文學(xué)數(shù)據(jù)研究指涉的對(duì)象只能是小數(shù)據(jù)樣本和簡(jiǎn)單計(jì)算分析。20世紀(jì)80年代,錢(qián)鋒、(16)陳大康、(17)丁寧、(18)、林興宅(19)等人曾提出文學(xué)與計(jì)算機(jī)科學(xué)、系統(tǒng)科學(xué)相結(jié)合的理論設(shè)想,利用數(shù)學(xué)建模和計(jì)算機(jī)自動(dòng)計(jì)算的方法,對(duì)文學(xué)作品的文體特征、審美風(fēng)格和作者身份辨識(shí)進(jìn)行研究。但在具體實(shí)踐中,受制于文學(xué)數(shù)據(jù)庫(kù)和計(jì)算技術(shù),大部分研究仍然集中在作品修辭風(fēng)格的計(jì)量分析上,“通過(guò)建立語(yǔ)料庫(kù),對(duì)文本語(yǔ)言的字符、段落、詞長(zhǎng)、詞類(lèi)、詞性以及高頻詞分布等特征項(xiàng)進(jìn)行統(tǒng)計(jì),運(yùn)用計(jì)算公式來(lái)計(jì)算平均段落長(zhǎng)度、詞長(zhǎng)變化、文本聚類(lèi)等”。(20)例如,武漢大學(xué)語(yǔ)言自動(dòng)處理研究組通過(guò)統(tǒng)計(jì)老舍的《駱駝祥子》的詞頻,來(lái)分析小說(shuō)的審美特征;(21)劉賓運(yùn)用數(shù)學(xué)建模技術(shù)分析《福樂(lè)智慧》,經(jīng)過(guò)電腦檢索、排序,編制成索引詞典的框架;(22)錢(qián)鋒、陳光磊通過(guò)比較巴金的《我們會(huì)見(jiàn)了彭德懷司令員》和倪海曙的《三輪摩托車(chē)》中的辭格、音律和章法,確認(rèn)巴金和倪海曙的小說(shuō)語(yǔ)言風(fēng)格;(23)與此類(lèi)似,王景丹通過(guò)統(tǒng)計(jì)曹禺等8位劇作家文本的句頻,確認(rèn)各自文體風(fēng)格;(24)吳禮權(quán)通過(guò)分析詞語(yǔ)、句式和修辭運(yùn)用,總結(jié)“簡(jiǎn)約”與“繁豐”審美風(fēng)格的基本特征。(25)從中不難看出,初始階段的文學(xué)數(shù)據(jù)研究以簡(jiǎn)單統(tǒng)計(jì)文本修辭為主,很少使用復(fù)雜的計(jì)算模型和計(jì)算技術(shù)。

21世紀(jì)以來(lái),隨著數(shù)字人文理論在國(guó)內(nèi)的傳播,以及眾多“關(guān)系型數(shù)據(jù)庫(kù)的建設(shè)、語(yǔ)言信息處理技術(shù)的發(fā)展和社會(huì)計(jì)量方法向人文領(lǐng)域的持續(xù)滲透”,(26)文學(xué)數(shù)據(jù)研究取得長(zhǎng)足進(jìn)步。例如,羅男運(yùn)用基于改進(jìn)的向量空間模型特征權(quán)重計(jì)算方法(TF-IDF)和潛在語(yǔ)義分析技術(shù)(LSI),分析15部金庸小說(shuō)中的字、詞匯、句子和段落4個(gè)語(yǔ)法單位,以此探究金庸小說(shuō)的語(yǔ)言風(fēng)格,并辨識(shí)《臥龍記》的真實(shí)作者;(27)張小宇在建立魯迅雜文語(yǔ)料庫(kù)、魯迅小說(shuō)語(yǔ)料庫(kù)和魯迅同時(shí)期作家雜文語(yǔ)料庫(kù)基礎(chǔ)上,使用語(yǔ)料庫(kù)檢索工具AntConc,計(jì)算魯迅雜文的詞長(zhǎng)、句長(zhǎng)、單音節(jié)詞和雙音節(jié)詞等17個(gè)語(yǔ)言特征出現(xiàn)比例,并與同時(shí)代作家的雜文語(yǔ)言特征進(jìn)行比較,以此總結(jié)魯迅雜文的語(yǔ)言風(fēng)格;(28)余韻為了證明巴金前后期小說(shuō)語(yǔ)言風(fēng)格的一致性,把巴金小說(shuō)劃分為6個(gè)階段,并建立相應(yīng)的語(yǔ)料庫(kù),在此基礎(chǔ)上,計(jì)算不同階段巴金小說(shuō)的詞長(zhǎng)分布,詞匯豐富度,共現(xiàn)詞、獨(dú)有詞、實(shí)詞和虛詞使用頻率;(29)與此類(lèi)似,金迪對(duì)格非和余華小說(shuō)語(yǔ)言風(fēng)格的研究,(30)時(shí)季對(duì)閻連科和劉震云小說(shuō)語(yǔ)言風(fēng)格的研究,(31)以及王少康、(32)年洪東、(33)李慧(34)對(duì)現(xiàn)代作家身份識(shí)別和作品辨?zhèn)蔚难芯慷紝儆诖朔N研究類(lèi)型。但上述文學(xué)數(shù)據(jù)研究仍沒(méi)有突破文體學(xué)、修辭學(xué)和語(yǔ)言學(xué)研究框架。

但我們也不能據(jù)此掩蓋一些學(xué)者在文學(xué)數(shù)據(jù)研究方面做出的開(kāi)創(chuàng)性探索,尤其是在小說(shuō)人物功能和社會(huì)網(wǎng)絡(luò)分析方面取得的突破。例如,吳蕙羽利用優(yōu)化后的Python技術(shù)、Pyecharts數(shù)據(jù)庫(kù)和Echarts數(shù)據(jù)可視化JS庫(kù),分析陳忠實(shí)的《白鹿原》中的人物關(guān)系和社會(huì)網(wǎng)絡(luò),并涉及人物情感分析。(35)但吳蕙羽的研究重心在計(jì)算技術(shù),而非小說(shuō)敘事,因而沒(méi)有得出與小說(shuō)敘事相關(guān)的結(jié)論。相對(duì)于此,趙薇對(duì)李劼人的“《大波》三部曲”的社會(huì)網(wǎng)絡(luò)和人物功能分析更為深入和透徹。趙薇運(yùn)用社會(huì)網(wǎng)絡(luò)分析(SNA)方法,利用數(shù)據(jù)挖掘、中心性計(jì)算和可視化技術(shù),分析《死水微瀾》《暴風(fēng)雨前》《大波》前后兩個(gè)版本5部小說(shuō)中的人物關(guān)系和社會(huì)網(wǎng)絡(luò),“對(duì)加權(quán)網(wǎng)絡(luò)中最高中介中心性節(jié)點(diǎn)所提示的關(guān)鍵人物的敘事功能進(jìn)行了深入探討”,(36)認(rèn)為“小人物”具有重要敘事功能,承擔(dān)了講述重大歷史事件的責(zé)任。除此以外,通過(guò)分析文學(xué)研究數(shù)據(jù)庫(kù),發(fā)現(xiàn)某一階段文學(xué)研究主題、(37)熱點(diǎn)、(38)發(fā)展趨勢(shì)和歷史軌跡,(39)以及學(xué)者影響力、(40)學(xué)科關(guān)聯(lián)(41)和學(xué)術(shù)刊物影響力(42)等內(nèi)容,成為文學(xué)數(shù)據(jù)研究的重要趨向。例如,丁帆、趙普光以當(dāng)代文學(xué)研究中的論題詞詞頻為考察中心,通過(guò)分析論題詞的頻率、集中程度和論題詞的顯隱等數(shù)據(jù),客觀呈現(xiàn)當(dāng)代文學(xué)研究70年發(fā)展軌跡。但文章沒(méi)有引入知識(shí)圖譜分析技術(shù),仍屬于傳統(tǒng)意義上的計(jì)量統(tǒng)計(jì)范疇。而謝靖、章鑫鑫在對(duì)CSSCI數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行清洗和格式轉(zhuǎn)化,以及設(shè)定頻次、中介中心度和聚類(lèi)指標(biāo)等參數(shù)基礎(chǔ)上,利用CtiespaceⅢ軟件計(jì)算2000—2011年期間CSSCI收錄的中國(guó)文學(xué)研究期刊發(fā)文情況,形成文學(xué)研究期刊關(guān)鍵詞共現(xiàn)圖譜,立體呈現(xiàn)這一期間中國(guó)文學(xué)研究熱點(diǎn)、發(fā)展趨勢(shì)和學(xué)科知識(shí)圖譜。(43)而且,通過(guò)統(tǒng)計(jì)中國(guó)文學(xué)期刊引文數(shù)據(jù),分析中國(guó)文學(xué)圖書(shū)學(xué)術(shù)影響力。(44)王賀則通過(guò)比較《解放日?qǐng)?bào)》數(shù)據(jù)庫(kù)的電子目錄、索引與紙質(zhì)版的差異,探討“數(shù)字人文”與傳統(tǒng)學(xué)術(shù)的關(guān)系。(45)

雖然文學(xué)數(shù)據(jù)研究在廣度和深度上都取得了一定程度的進(jìn)步,但還不是真正意義上的文學(xué)大數(shù)據(jù)研究:一方面,當(dāng)代文學(xué)人物關(guān)系和社會(huì)網(wǎng)絡(luò)研究、當(dāng)代文學(xué)關(guān)聯(lián)數(shù)據(jù)庫(kù)研究、當(dāng)代作家檔案數(shù)據(jù)研究、當(dāng)代文學(xué)學(xué)術(shù)地圖和知識(shí)譜系研究、基于共現(xiàn)分析的文本知識(shí)挖掘研究、當(dāng)代文學(xué)研究者的隱性合作關(guān)系研究等諸多方面仍然存在進(jìn)一步深挖的空間;另一方面,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)生產(chǎn)的文學(xué)大數(shù)據(jù)還沒(méi)得到充分利用,基本處于擱置狀態(tài)。例如,豆瓣讀書(shū)、微信、微博生產(chǎn)的文學(xué)數(shù)據(jù)及其關(guān)涉的人物情感和社會(huì)心態(tài)、文學(xué)的網(wǎng)絡(luò)主題模型、游戲文學(xué)的虛擬現(xiàn)實(shí)、界面文學(xué)的知識(shí)挖掘、新媒體文學(xué)的知識(shí)圖譜等眾多研究話(huà)題還沒(méi)有充分展開(kāi)。之所以出現(xiàn)這種態(tài)勢(shì),是因?yàn)楝F(xiàn)階段文學(xué)大數(shù)據(jù)研究存在一些困境和癥結(jié),為文學(xué)大數(shù)據(jù)研究從理論構(gòu)想進(jìn)入現(xiàn)實(shí)實(shí)踐從而產(chǎn)生真正價(jià)值設(shè)置了壁壘。這也是當(dāng)代文學(xué)研究范式轉(zhuǎn)型亟須解決的問(wèn)題。

三、文學(xué)大數(shù)據(jù)研究的困境和癥結(jié)

當(dāng)代文學(xué)大數(shù)據(jù)研究仍處于起步階段,難以避免出現(xiàn)諸多困境,我們需要直面這些癥結(jié),尋找解決問(wèn)題的方法和路徑,在此基礎(chǔ)上推進(jìn)當(dāng)代文學(xué)研究的發(fā)展。現(xiàn)階段,當(dāng)代文學(xué)大數(shù)據(jù)研究面臨專(zhuān)題數(shù)據(jù)庫(kù)少、跨學(xué)科合作度低、研究方法認(rèn)同度低、研究范圍窄、研究學(xué)者少、專(zhuān)業(yè)學(xué)術(shù)期刊少、學(xué)術(shù)評(píng)價(jià)體系缺失、學(xué)科專(zhuān)業(yè)建設(shè)緩慢、課堂教學(xué)滯后和網(wǎng)絡(luò)基礎(chǔ)設(shè)施建設(shè)薄弱等問(wèn)題。

文學(xué)大數(shù)據(jù)研究的基礎(chǔ)是數(shù)據(jù),包括數(shù)字文學(xué)文本和文獻(xiàn)史料及其數(shù)據(jù)化后形成的各種文學(xué)專(zhuān)題數(shù)據(jù)庫(kù),也包括文學(xué)文本在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和社交網(wǎng)絡(luò)傳播產(chǎn)生的文學(xué)大數(shù)據(jù)。但大數(shù)據(jù)的海量、動(dòng)態(tài)和價(jià)值密度低等特性使數(shù)據(jù)庫(kù)建設(shè)存在較大難度。比較便捷和高效的方式是利用數(shù)據(jù)挖掘、分析和顯示技術(shù)針對(duì)特定大數(shù)據(jù)進(jìn)行研究。因此,文學(xué)專(zhuān)題數(shù)據(jù)庫(kù)和文學(xué)研究專(zhuān)題數(shù)據(jù)庫(kù)建設(shè)尤為重要。但現(xiàn)實(shí)情況是,已建成的中國(guó)現(xiàn)當(dāng)代文學(xué)及其研究專(zhuān)題數(shù)據(jù)庫(kù)仍然很少,主要集中在“民國(guó)圖書(shū)數(shù)據(jù)庫(kù)”(46)“晚清和民國(guó)全文期刊數(shù)據(jù)庫(kù)”(47)“《申報(bào)》全文數(shù)據(jù)庫(kù)”(48)“《大公報(bào)》(1902—1949)數(shù)據(jù)庫(kù)”(49)“近代上海方志資料數(shù)據(jù)庫(kù)”(50)“民國(guó)文獻(xiàn)大全數(shù)據(jù)庫(kù)”(51)“解放前報(bào)刊題錄數(shù)據(jù)庫(kù)”(52)“民國(guó)圖片資源庫(kù)”(53)“民國(guó)時(shí)期文獻(xiàn)數(shù)據(jù)庫(kù)”(54)“大成故紙堆”(55)“典海民國(guó)圖書(shū)資源平臺(tái)”(56)“民國(guó)圖書(shū)數(shù)字化資源庫(kù)”(57)等民國(guó)文學(xué)數(shù)據(jù)庫(kù)上。而當(dāng)代作家作品及其研究文獻(xiàn)數(shù)據(jù)庫(kù)、當(dāng)代文學(xué)期刊數(shù)據(jù)庫(kù)和當(dāng)代文學(xué)史數(shù)據(jù)庫(kù)等與當(dāng)代文學(xué)研究直接相關(guān)的專(zhuān)題數(shù)據(jù)庫(kù)非常稀少。這一問(wèn)題已得到學(xué)術(shù)界的重視,陸續(xù)啟動(dòng)了“網(wǎng)絡(luò)文學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)”“漢譯文學(xué)編年考錄及數(shù)據(jù)庫(kù)建設(shè)”“中國(guó)現(xiàn)代文學(xué)報(bào)刊作品系年及數(shù)據(jù)庫(kù)建設(shè)”“中國(guó)新詩(shī)傳播接受文獻(xiàn)集成、研究及數(shù)據(jù)庫(kù)建設(shè)”“抗戰(zhàn)大后方文學(xué)史料數(shù)據(jù)庫(kù)建設(shè)”“‘學(xué)衡派’年譜長(zhǎng)編及文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)”“延安時(shí)期未刊文獻(xiàn)資料收集、整理與數(shù)據(jù)庫(kù)建設(shè)”(58)等項(xiàng)目。只有完成基礎(chǔ)性的專(zhuān)題數(shù)據(jù)建設(shè),才能為文學(xué)大數(shù)據(jù)研究提供支持。

文學(xué)大數(shù)據(jù)研究作為新興的研究范式,從大規(guī)模的理論引入研究實(shí)踐不過(guò)十幾年的時(shí)間,學(xué)術(shù)界對(duì)這種研究范式始終保持足夠的距離和警惕,這種研究范式還沒(méi)有形成共識(shí)。這種認(rèn)同情境來(lái)源于三個(gè)方面:第一,文學(xué)大數(shù)據(jù)研究運(yùn)用的數(shù)據(jù)計(jì)量分析、實(shí)證性方法與文學(xué)的審美性、精神性特征相沖突,削減了文學(xué)的人文價(jià)值。人們擔(dān)心對(duì)“計(jì)算”方法的推崇,會(huì)使文學(xué)研究滑向技術(shù)中心主義,形成算法霸權(quán),成為技術(shù)的注腳,喪失自身的獨(dú)立性。因而,這種研究范式“對(duì)于文學(xué)研究而言,卻只能是一種手段和工具,研究者的才情、趣味、智性決定了研究的深度和走向”。(59)第二,文學(xué)大數(shù)據(jù)研究的根基是數(shù)據(jù)庫(kù)和計(jì)算技術(shù),只有不斷優(yōu)化和更新相關(guān)計(jì)算技術(shù),才能推進(jìn)文學(xué)大數(shù)據(jù)研究的深入發(fā)展。一旦計(jì)算技術(shù)更新緩慢或停滯不前,這種研究范式也將處于懸停狀態(tài)。因而人們對(duì)這種研究范式的長(zhǎng)效性持懷疑態(tài)度,“是否能夠從歷史的長(zhǎng)線(xiàn)來(lái)對(duì)文學(xué)史現(xiàn)象和作家作品做出相對(duì)超越性的評(píng)價(jià),是存有疑問(wèn)和不無(wú)難度的”。(60)第三,文學(xué)大數(shù)據(jù)研究需要研究者熟練掌握和運(yùn)用計(jì)算技術(shù),而計(jì)算技術(shù)體系和理論結(jié)構(gòu)較為復(fù)雜,涉及數(shù)字化技術(shù)、數(shù)據(jù)管理技術(shù)和數(shù)據(jù)分析技術(shù)等多個(gè)層面,僅文本挖掘技術(shù)就涉及信息抽取、文本分類(lèi)、文本聚類(lèi)、關(guān)聯(lián)規(guī)則和模式發(fā)現(xiàn)等眾多方面,相關(guān)的計(jì)算軟件更是種類(lèi)繁多。對(duì)人文學(xué)者而言,想要短期內(nèi)掌握計(jì)算技術(shù),且能夠熟練使用計(jì)算軟件,存在較大難度。而能夠獨(dú)立“運(yùn)用計(jì)算方法解答、探討或是思索人文問(wèn)題的研究者”(61)更是寥寥無(wú)幾。這就不難理解為何大部分文學(xué)大數(shù)據(jù)研究都集中在理論反思和論爭(zhēng)層面,很少拓展到計(jì)算技術(shù)分析層面。

文學(xué)大數(shù)據(jù)研究是一種跨學(xué)科研究方法,它與統(tǒng)計(jì)學(xué)、信息管理學(xué)和計(jì)算機(jī)科學(xué)等其他學(xué)科有直接關(guān)聯(lián)。同時(shí),文學(xué)也以其獨(dú)特的人文特性反思文學(xué)大數(shù)據(jù)本身的價(jià)值和意義,實(shí)現(xiàn)文學(xué)與數(shù)據(jù)和計(jì)算之間的多重互動(dòng)。在此意義上,文學(xué)大數(shù)據(jù)研究具有明顯的交叉學(xué)科研究特征,它“促使各人文學(xué)科突破學(xué)科邊界,加強(qiáng)不同學(xué)科理論與方法的交流與合作”。(62)這就決定了研究者需要進(jìn)行跨學(xué)科、跨專(zhuān)業(yè)的協(xié)同創(chuàng)新研究。但當(dāng)前文學(xué)大數(shù)據(jù)研究還沒(méi)有真正實(shí)現(xiàn)跨學(xué)科研究,文學(xué)研究者的關(guān)注點(diǎn)集中在文學(xué)大數(shù)據(jù)研究的人文反思上,其他學(xué)科的研究者聚焦在計(jì)算技術(shù)上,二者處于不同的研究向度,無(wú)法真正交融在一起。類(lèi)似陳大康、錢(qián)鋒、劉石、趙薇等學(xué)者能夠?qū)崿F(xiàn)二者之間的融合,是因?yàn)樗麄儽旧砭哂锌鐚W(xué)科背景和扎實(shí)的數(shù)學(xué)功底,能夠熟知計(jì)算原理,獨(dú)立構(gòu)建數(shù)學(xué)模型和使用計(jì)算工具。但大部分研究者仍在技術(shù)外圍摸索和徘徊。這種局面的形成與國(guó)內(nèi)數(shù)字人文專(zhuān)業(yè)設(shè)置和相關(guān)教學(xué)環(huán)節(jié)薄弱密切相關(guān)。目前,只有中國(guó)人民大學(xué)信息資源管理學(xué)院在圖書(shū)情報(bào)與檔案管理一級(jí)學(xué)科下,設(shè)立了數(shù)字人文二級(jí)學(xué)科。而根據(jù)國(guó)家數(shù)字人文組織聯(lián)盟統(tǒng)計(jì),在2007—2014年期間,國(guó)外設(shè)置數(shù)字人文專(zhuān)業(yè)的高校多達(dá)180余所,(63)并形成了從本科到研究生完備的培養(yǎng)體系。(64)而且,國(guó)內(nèi)外高校在相關(guān)課程設(shè)置方面也有較大差距。截止到2020年,開(kāi)設(shè)數(shù)字人文相關(guān)課程的美國(guó)高校就有41所,(65)包括斯坦福大學(xué)、耶魯大學(xué)和伊利諾伊大學(xué)香檳分校等世界知名高校。而國(guó)內(nèi)只有清華大學(xué)、北京大學(xué)、武漢大學(xué)、西安交通大學(xué)、汕頭大學(xué)、南京大學(xué)、上海師范大學(xué)等少數(shù)高校開(kāi)設(shè)了數(shù)字人文課程。同時(shí),在課程的數(shù)量、教學(xué)體系建設(shè)和實(shí)踐應(yīng)用方面,國(guó)內(nèi)外也存在較大差距。國(guó)內(nèi)數(shù)字人文研究中心和人文計(jì)算實(shí)驗(yàn)室建設(shè)推進(jìn)緩慢,只有武漢大學(xué)、清華大學(xué)和上海師范大學(xué)等為數(shù)不多的高校成立了數(shù)字人文研究中心。而國(guó)外的數(shù)字人文研究中心和實(shí)驗(yàn)室多達(dá)百余家,并且不斷輸出學(xué)術(shù)成果。(66)尤其是斯坦福文學(xué)實(shí)驗(yàn)室、倫敦國(guó)王學(xué)院數(shù)字人文實(shí)驗(yàn)室、耶魯大學(xué)數(shù)字人文實(shí)驗(yàn)室和普林斯頓數(shù)字人文中心在世界范圍內(nèi)都產(chǎn)生了重要影響力。

雖然文學(xué)大數(shù)據(jù)研究還存在諸多困境,但不能就此否認(rèn)它的價(jià)值。除了為當(dāng)代文學(xué)研究提供新的研究技術(shù)和方法,也為文學(xué)研究共同體的形成提供了可能性和實(shí)踐路徑。謝剛、江震龍?jiān)凇冬F(xiàn)代中國(guó)民族文學(xué)觀與共同體詩(shī)學(xué)建構(gòu)》一文中深入闡釋了民族文學(xué)共同體意識(shí)和共同體詩(shī)學(xué),認(rèn)為其實(shí)質(zhì)“是一與多、己與群、局部與整體、差異性與共同性的辯證統(tǒng)一”,(67)并體現(xiàn)為民族審美共同體意識(shí)、辯證的詩(shī)學(xué)特征、包容共生的文學(xué)倫理觀和以人民為中心的民族文藝本質(zhì)。謝剛、江震龍對(duì)共同體意識(shí)和共同體詩(shī)學(xué)的理論建構(gòu)深刻而透徹,既沒(méi)有完全模仿西方的共同體理論,也沒(méi)有拘泥于中國(guó)傳統(tǒng)的共同體觀念,而是在中西理論之間尋找到恰切的平衡點(diǎn)。或者說(shuō),是站在中國(guó)文學(xué)的立場(chǎng)上構(gòu)建世界文學(xué)的共同體意識(shí)和詩(shī)學(xué),因此具有很強(qiáng)的理論價(jià)值和實(shí)踐參考意義。按照謝剛、江震龍的邏輯推論,文學(xué)研究共同體的實(shí)質(zhì)也是“多”與“一”的辯證關(guān)系。而當(dāng)代文學(xué)研究沒(méi)能處理好這種辯證關(guān)系,走向了共同體的反面。當(dāng)下反全球化和逆全球化思潮在不同領(lǐng)域設(shè)置了構(gòu)建共同體的壁壘?;蛘哒f(shuō),共同體和反共同體在發(fā)生機(jī)制、運(yùn)作模式和實(shí)踐路徑等方面遵循相同的原則和規(guī)律,二者之間的界限既涇渭分明又曖昧模糊。這種共同體危機(jī)意識(shí)和反共同體情態(tài)也在當(dāng)代文學(xué)研究中存在,以文學(xué)研究范式的斷裂、顛覆和重建為表征,具體體現(xiàn)為文學(xué)政治研究、文學(xué)社會(huì)研究、文學(xué)歷史研究、文學(xué)審美研究和文學(xué)技術(shù)研究幾種研究范式之間的矛盾及研究范式的內(nèi)部沖突?;诖耍?dāng)代文學(xué)研究史可以看作文學(xué)研究共同體與反共同體的關(guān)系史。但關(guān)鍵問(wèn)題不是幾種研究范式是如何斷裂的,而是如何繼承和轉(zhuǎn)換的。一種研究范式的興起如何從另一種消隱的研究范式中汲取有價(jià)值的資源。也就是說(shuō),文學(xué)大數(shù)據(jù)研究的興起并不全然意味著原有研究范式的失效,而是研究范式之間的整合和重組。文學(xué)大數(shù)據(jù)研究的實(shí)質(zhì)是從數(shù)據(jù)角度挖掘和呈現(xiàn)文學(xué)新變,但新變不是顛覆文學(xué)的審美性和精神性特質(zhì),而是以數(shù)據(jù)進(jìn)一步證實(shí)和豐富文學(xué)的審美性和精神性,并發(fā)現(xiàn)其中的新內(nèi)容、新樣態(tài)和新趨勢(shì)。文學(xué)研究應(yīng)在數(shù)據(jù)技術(shù)加持下變得更客觀、理性,更符合當(dāng)下對(duì)文學(xué)研究提出的要求。文學(xué)大數(shù)據(jù)研究建構(gòu)的技術(shù)化研究秩序不是劃出文學(xué)研究的固定邊界,而是提倡文學(xué)研究的敞開(kāi)性,為人文與科技共同體搭建一條順暢通道。我們提倡的文學(xué)研究共同體意識(shí),針對(duì)的不僅是反共同體觀念,而是以共同體意識(shí)為根基,接續(xù)和重建不同研究范式之間的內(nèi)在關(guān)聯(lián),“借以窺探某一歷史時(shí)刻的集體性是什么,它的需求是什么,它的矛盾性何在,它的問(wèn)題何在等問(wèn)題”,(68)尋找解決原有文學(xué)研究范式癥結(jié)的路徑,從而建立不同文學(xué)研究范式之間的結(jié)構(gòu)關(guān)系,因?yàn)椤八鼈兗扔新?lián)系又有差異,共同推進(jìn)文學(xué)創(chuàng)作和文學(xué)研究的發(fā)展”。(69)而且,一種新的文學(xué)研究范式的價(jià)值不僅體現(xiàn)在方法論層面,更體現(xiàn)在價(jià)值論層面。在不同研究范式之間尋求價(jià)值觀的最大公約數(shù),在此基礎(chǔ)上構(gòu)建當(dāng)今社會(huì)具有引領(lǐng)作用的價(jià)值觀,這是推進(jìn)當(dāng)代文學(xué)研究發(fā)展的重要前提條件之一。在此意義上,當(dāng)代文學(xué)研究范式轉(zhuǎn)型絕不是線(xiàn)性時(shí)間鏈條上的替代問(wèn)題,而是不同研究范式在對(duì)話(huà)中的相互補(bǔ)充和再造。它既是當(dāng)下的又是歷史的也是未來(lái)的,但絕不是唯一的、霸權(quán)的和僵化的。