為人文社科研究插上數字羽翼
數字技術使人類生活方式發(fā)生了翻天覆地的變化,而數字化應用也給人文社科研究帶來了巨大的驅動力。記錄與保存、創(chuàng)新與傳承、傳播與發(fā)展,人文社科研究利用數字化技術將實物載體或理論成果,以多元化的形式儲存于數字空間,在一定程度上打破了研究的時空局限。徜徉數字的汪洋大海,如何放寬學術視野,拓展研究路徑,成為很多人文社科學者關注的焦點。
數字邂逅古人浪漫詩詞
一直以來,資料離散和時空分離是古代文學研究的兩大難題,中南民族大學數字人文資源研究中心主任王兆鵬表示,數字技術將改變古代文學資料查詢檢索方式,實現從電子文獻的分詞定位檢索到結構化數據庫的分類提取,從點狀檢索到網狀關聯,從逐條拷貝到分類打包。數字技術還可以自動對比識別作品間的互文關系,重建古代文學的歷史現場,提供古代文學閱讀欣賞的嶄新體驗。
“唐宋文學編年地圖”就是一張可以看懂唐宋詩人一生的特殊地圖。登錄該地圖平臺,我們可以跟隨蘇軾的“步伐”,看到他意氣風發(fā)時的作品,也可以感受到其被貶后,在黃州留下《赤壁賦》的心情。點擊切換洛陽,便可發(fā)現有57位詩人曾在此留下了603首詩歌,其中不乏《次北固山下》《芙蓉樓送辛漸》等名篇。借助地圖,我們可以更深入地感受到韓愈“一封朝奏九重天,夕貶潮陽路八千”的痛苦,還能了解韓愈南貶途中經行之地的地形地貌。
正是數字化技術讓歷史上一群人、一代人的活動軌跡同時呈現,一個時期的文學生態(tài)、文壇活動圖景由此得以還原性建構。王兆鵬告訴記者,過去我們可能只知道一個或幾個作家曾經在某地的經歷和作品,有了“唐宋文學編年地圖”,我們就可以了解某個時間點或者時間段內所有作家的活動軌跡?!芭c全文檢索數據庫僅能提供字詞檢索最大的不同是,文學編年地圖可以提供更多考量維度,提供更多知識點?!蓖跽座i說。
錢鍾書先生早在1984年就在中國社會科學院倡導把計算機技術引入中國古典文獻的搜集、疏證和整理中。記者了解到,近20多年來,我國在古籍文獻數字化和古籍數據庫建設方面成就巨大,在一定意義上推動了學術的發(fā)展。但這些數據庫的主體內容除全文檢索外,并沒有完成更深入的工作。因此,對古籍文獻數據庫進行升級換代勢在必行。
新一代信息技術和人工智能技術等,能夠高效抓取研究所需要的數據資料,通過智能化的信息挖掘,幫助學者從數據中發(fā)現現象或事物的本質和彼此間的邏輯關聯。中國社會科學院數量經濟與技術經濟研究所研究員李金華表示,數字化背景下,需要用全新的思維、全新的方法處理資料和選擇數據,以此獲得有價值的信息。學者科學解讀復雜信息所蘊含的真義,準確把握經濟、社會、文化發(fā)展的規(guī)律、特征和趨勢走向,從而提升人文社會科學的研究水平和研究質量。
智慧數據之光照進文遺
千年莫高,藝術瑰寶。當敦煌文化搭乘數字化列車跨入新時代的發(fā)展軌道時,“數字敦煌”實現了跨越時空的穿梭。
記者登錄“數字敦煌”資源庫,30個經典洞窟,4430平方米絕美壁畫,穿越10個朝代呈現眼前。人們不僅可以通過VR全方位細細欣賞這些石窟,甚至能比直接走進洞窟獲得更為震撼的沉浸式藝術體驗,同時還大大減少了人體、空氣流動以及濕度變化對壁畫的傷害。
敦煌文化遺產數字化工程積累的海量學術文獻資料與高保真數字資源,為敦煌文化遺產的保護、研究和傳播提供了良好的基礎保障。近年來,武漢大學與敦煌研究院通力合作,圍繞敦煌智慧數據資源建設與服務應用開展了一系列探索性工作。武漢大學大數據研究院常務副院長王曉光告訴記者,智慧數據和智能計算理念的興起,為敦煌文化遺產的創(chuàng)造性轉化和創(chuàng)新性發(fā)展提供了可能。敦煌智慧數據資源建設的主要內容,包括敦煌文化遺產主題詞表構建與關聯數據發(fā)布、敦煌文化遺產本體模型設計與應用、敦煌壁畫圖像與遺書文本的深度語義標注、敦煌數字資產管理與數字敘事系統開發(fā)、敦煌文化遺產知識圖譜構建與應用服務、敦煌遺書數字化復原與數字記憶再造等。
“敦煌智慧數據資源建設與服務工作,繼承了‘數字敦煌’項目的建設目標,不僅能夠進一步支撐敦煌相關的歷史、文學、藝術等學術研究的數字化轉型,也有利于促進敦煌文化遺產的保護、傳承和傳播工作,提升大眾對敦煌文化遺產相關知識的理解和認知水平,也為在國際上講好中國故事和利用先進技術實現文化遺產保護的中國方案提供了支撐?!蓖鯐怨庹f。
數字圖書館和數字出版的發(fā)展,使得數字形態(tài)的學術文獻資源成為學術研究的主流。如今,學者足不出戶就可以獲得全球各大圖書館的稀有文獻資料。數字化應用給人文社科研究既帶來了文獻資料獲取的豐富性和便利性,也帶來了方法和范式的變革。
“隨著海量數字資源的產生和積累,人類文化遺產的范疇也在擴展,并引發(fā)了新的人文學術問題,如數字遺產、數字記憶等?!蓖鯐怨庹劦溃诖笠?guī)模數字文獻資料和專題數據庫支撐下,文本挖掘、社會網絡分析、情感計算、數字化模擬復原分析等各種新興研究方法和研究手段的應用,改變了以往以人文學者個體分析和闡釋分析為主的范式。通過文獻資料的數據化和語義化建模,增強了文獻資料的功能可供性,同時也借助各種分析性軟件工具和數字平臺,提升了人文學者獲取、分析、比對的效率。
引領人文時空數字化轉換
人類現有的知識將陸續(xù)轉化為數字形式,再加上數字世界原生的知識(如互聯網本身),人們已從知識匱乏變成知識過盛?!稊底秩宋摹肪幬:1硎?,數字時代人文領域的知識轉型,一種是呈現式,即把現有知識通過數字化方式呈現,即知識表示;另一種是研究式,即借助數字化方式發(fā)現新知,即知識發(fā)現。知識表示的數字化,呼喚與之相應的知識發(fā)現方式。知識發(fā)現方式的變化,反過來又引發(fā)了知識表示的進一步變革。到最后,實質都是把閱讀文獻的主體從人變成機器,進而可以用數字技術進行文本分析。他列舉了兩篇數字人文研究的文章。一篇是對科幻小說敘事形式的研究,以算法區(qū)分“展示”和“告知”兩種敘事形式,發(fā)現主流文學的敘事節(jié)奏普遍快于科幻小說,為敘事分析提供了新的視角。另外一篇在計量文學史視角下分析經濟學、種族和美國戰(zhàn)后小說。文章通過對近五千部美國當代小說進行建模分析發(fā)現,20世紀70年代中期白人男性寫的小說中經濟學語言增長明顯,該研究的樣本體量令傳統研究難以望其項背。
上海社會科學院社會學研究所研究員陶希東進一步表示,數字時代,人文社科研究無論在理論研究還是方法論上都面臨數字化轉型,在理念和思維上也出現了新的變化,如數據庫建設和應用風行、定性與定量研究并重、從知識關聯中探尋新的研究結論等。同時,網絡問卷、大數據分析等現代研究方式,使得學者獲取資料的效率極大提高,樣本代表性進一步增強。
辯證對待人文領域數字化應用
盡管目前人文社科數字化還缺乏成熟成果,但已展現出令人鼓舞的潛力。桑海介紹了關于中國古典詩歌聲律統計分析與研究的一些新進展,提出通過對古典詩歌語料庫中的聲律現象進行統計分析,找出聲律現象的規(guī)律。若此研究能在大數據基礎上進行全面統計分析,相信會使執(zhí)著于局部規(guī)律的舊說失去其有效性,并對整個學科發(fā)展產生更大影響。
面對大數據和數字處理技術給人文社會科學研究提供的豐富素材和研究新模式、新思路,李金華提出,要辯證對待數字技術在人文社會科學研究中的應用,避免科學研究對軟件、分析技術的依賴,避免研究成果陷入信息的孤島。他說,人文社會科學研究的是人的思想、情感、觀念、精神、價值,研究的是人以及人與人之間的關系,人文社會科學成果是有思想、有溫度、有價值取向的。應保持人文社會科學研究的獨立性、嚴肅性和人性光輝,推動人文社會科學研究科學性和批判性的協調發(fā)展。
在陶希東看來,數字化浪潮下人文社科發(fā)展主要有兩條路徑,一是順應數字化社會的趨勢和規(guī)律,圍繞國家數字經濟、數字治理、數字社會發(fā)展中碰到的重大問題,不斷拓展研究領域;二是轉變和更新傳統的研究方法,在融合利用現代科技手段上下功夫,增強研究成果的理論性、科學性、指導性。此外,還要重視人文社科領域數字化人才的培養(yǎng),主動組織開展普適性學習,更要實施專業(yè)化培訓,提高在研究中對數字化技術的利用能力。
“數據、技術終究是工具,核心是人,數字化技術不論如何發(fā)展,人文社科領域研究始終要堅守‘思想創(chuàng)新、觀點創(chuàng)新’的初心,要以產生‘偉大思想’為榮、‘出大師’為要?!碧障|說。
談及對人文社科數字化應用發(fā)展的期待,王曉光表示,面對數字文明的興起,人文社科的數字化轉型應該加快行動步伐,積極開展數據驅動與理論驅動的研究范式的探索性融合。學術研究只有走在數字化文明發(fā)展的前沿,才能指引社會發(fā)展的方向,規(guī)避文明建設的陷阱。期待高等教育與科研界加快數字化應用步伐,在反思與審慎批判中,創(chuàng)新學術研究與文化傳承手段,并借助“新文科”建設良機,推動“三大體系”建設。
數字技術的應用與賦能有望觸發(fā)人文社科研究在知識基礎、方法論和評價體系等多方面的反思與進步,借助數字的羽翼,一個學科大碰撞、知識大融通的時代正在到來。