fbpx
Home 新鮮推薦當月精選 【當月精選】文學近未來|文學字詞的拱廊街計畫──詞頻分析的結果觀察

【當月精選】文學近未來|文學字詞的拱廊街計畫──詞頻分析的結果觀察

by 蕭鈞毅
文學近未來

我認為詞頻分析對於辨析文學風格問題,有非常正面的效果。以兩點討論:

第一,把小說家還原成選擇字詞的人,呈現出小說家的「選擇」。

比方說,我們能做出以下幾種遊戲:把分析成果匿名,交由經驗讀者指名;或發給每一個讀者不同小說家的分析成果,由讀者依賴成果上的字詞量與出現頻率,重組一篇小說。這好像把小說看得簡單了,是一種能被零件就地「還原」的品項──如《如果在冬夜,一個旅人》敘事者所擔憂的──彷彿我們得到相應的組件,我們就有辦法還原一本《殺鬼》或《邦查女孩》。

我們都知道事情沒那麼簡單。這項工程不只沒把文學看小了,反而經由數據與詞量,展示了小說的最基礎層面:字詞──巨大的起源、零件,陳列了小說家在有限之中的「選擇」。

分析的重要意義,因此不只是讀者是否能「還原」一篇小說的辯論,而是能否「指認」出分析成果屬於誰的「風格」、與構成「風格」的具體條件為何──分析的結果可說是將甘耀明長篇小說的零件一字排開,放在無盡長桌的紅桌巾上展示:就像是以零件展示尚未存在的整體,以算式展示它對應的數學問題──但這仍有不精準處,因為這之間的變項是讀者的詮釋,它不保證看到一則算式就能回推出相對的問題(很可能會推導到其他可用這算式的問題);就像「中立」的詞頻分析,若要由此分析風格,要由經驗讀者操作才能有效──但這也意味著,在讀者端這邊,既定的風格印象很可能會影響數據解讀。而且,我們能看見的可能只是「傾向」,並非風格的絕對定義,若要更細緻,就必須設計能處理句型或句構的方法。

第二,除去題材選用、小說人名、特定時空用詞等條件,我們能夠從小說文本的慣用字詞識別出用字遣詞的傾向。具體來說,假設「或」開頭的連接詞時常重複,那就展示了小說家組合句子時將對立項並置的傾向,構成一種讓讀者看見「猶豫」的腔調;或動詞重複說明了小說裡被篩選出的特定動作、形容詞選用表示小說家擅用的世界觀、又比如抓出最常用的「時貌」(如「著」)可以觀察文本的時間觀(這還能是語言學的案例)……等等。字詞的分析結果,按照重複量或對照項,若將甘耀明和其他小說家對照,相信會有解釋「風格」的新線索。

這裡我僅能先以甘耀明四本長篇為例解讀數據:數據分析出Top 20的字詞,共十九個名詞與唯一一個動詞「開車」。Top 20不是說甘耀明四本長篇的人總在開車,它說明的是「開車」這個動作,在四本小說的出現頻率有被觀察的必要。二十個詞在四本小說是以函數的方式成為前二十名,「開車」在四本小說裡頭可能都不是出現最頻繁的詞。

那麼讀者應如何觀察,觀察什麼?字詞作為依據,我們能從「開車」按圖索驥,先從題材與時空判斷字詞的適用性(比方《殺鬼》的「開車」僅出現兩次),再找出每一本小說裡頭對應的段落跟脈絡頭對應的段落跟脈絡,判斷該字詞是用以修辭、描述,或其他。這有助於我們釐清字詞在文本之中的效果,如「士兵」一詞在《冬將軍》一書作為故事轉述的名詞,而《殺鬼》裡頭是「常見的」名詞,且因為文本的時空背景,士兵不只是名詞,它同時在故事裡頭也是「角色」與「修辭」,以其殖民政權的特性,成為構組《殺鬼》世界觀的零件。

再如「資源」,這詞是詞頻分析目前不足之處;在《冬將軍》一書裡出現七次,七次其實都是「資源回收」一詞被截斷後的數據。我們應從此轉向分析「資源回收」一詞在《冬將軍》的效果,可是對照另外三本小說,就無法成立。

其他如「妳是」,除非第二人稱小說,否則大概都在對話裡,最極限地詮釋它,也只能理解為甘耀明在小說裡角色口吻的共性,可是這詮釋不只沒必要,且漏洞百出;或「兵」可能是「士兵」的刪減、「爸爸」放在不同角色的口中或視角,至多也就表示甘耀明小說中必會出現的人物-家族構成──可是我們也很難在任一本小說中找不到「爸爸」。

簡略操作下來,會發現統計的結果不一定能具體對應每部文本,且搜尋文本證據的過程非常費工;但這樣的方式,已是現階段文學文本分析一條精簡的路。我們要留意的,不只是從數據對應文本找尋上下文,還有對重複用詞詞性構成的效果解讀,並無一定標準。當我說連接詞「或」構成「猶豫」的語氣時,其他讀者可能有相反感受,這就需要更準確的文本分析證據。就目前而言,仍須更細緻的解讀方法(文學或統計學方法?)才能更妥善解讀數據。

總結來說,這項工程不只是辨析風格,若擴張對照組、分析項目,且方法化解讀方式,它很有機會,能提供如文學史上語言轉換(修辭、意象、句構或語法)這般規模問題的直接證據。

 


蕭鈞毅
一九八八年生,清大台文所博士生。曾獲台北文學獎小說首獎、林榮三文學獎小說首獎等。作品入選九歌出版《一○四小說選》,電子書評刊物《秘密讀者》編輯同仁之一。自己主攻小說書寫與小說評論,研究則遙遙無期。

 

◆本文原刊載於《聯合文學》第399期

You may also like

發表意見

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料