Home 新鲜推荐当月精选 【当月精选】文学近未来|文学字词的拱廊街计画──词频分析的结果观察

【当月精选】文学近未来|文学字词的拱廊街计画──词频分析的结果观察

written by 萧钧毅 2018-01-01
【当月精选】文学近未来|文学字词的拱廊街计画──词频分析的结果观察

我认为词频分析对于辨析文学风格问题,有非常正面的效果。以两点讨论:

第一,把小说家还原成选择字词的人,呈现出小说家的「选择」。

比方说,我们能做出以下几种游戏:把分析成果匿名,交由经验读者指名;或发给每一个读者不同小说家的分析成果,由读者依赖成果上的字词量与出现频率,重组一篇小说。这好像把小说看得简单了,是一种能被零件就地「还原」的品项──如《如果在冬夜,一个旅人》叙事者所担忧的──仿佛我们得到相应的组件,我们就有办法还原一本《杀鬼》或《邦查女孩》。

我们都知道事情没那么简单。这项工程不只没把文学看小了,反而经由数据与词量,展示了小说的最基础层面:字词──巨大的起源、零件,陈列了小说家在有限之中的「选择」。

分析的重要意义,因此不只是读者是否能「还原」一篇小说的辩论,而是能否「指认」出分析成果属于谁的「风格」、与构成「风格」的具体条件为何──分析的结果可说是将甘耀明长篇小说的零件一字排开,放在无尽长桌的红桌巾上展示:就像是以零件展示尚未存在的整体,以算式展示它对应的数学问题──但这仍有不精准处,因为这之间的变项是读者的诠释,它不保证看到一则算式就能回推出相对的问题(很可能会推导到其他可用这算式的问题);就像「中立」的词频分析,若要由此分析风格,要由经验读者操作才能有效──但这也意味着,在读者端这边,既定的风格印象很可能会影响数据解读。而且,我们能看见的可能只是「倾向」,并非风格的绝对定义,若要更细致,就必须设计能处理句型或句构的方法。

第二,除去题材选用、小说人名、特定时空用词等条件,我们能够从小说文本的惯用字词识别出用字遣词的倾向。具体来说,假设「或」开头的连接词时常重复,那就展示了小说家组合句子时将对立项并置的倾向,构成一种让读者看见「犹豫」的腔调;或动词重复说明了小说里被筛选出的特定动作、形容词选用表示小说家擅用的世界观、又比如抓出最常用的「时貌」(如「著」)可以观察文本的时间观(这还能是语言学的案例)……等等。字词的分析结果,按照重复量或对照项,若将甘耀明和其他小说家对照,相信会有解释「风格」的新线索。

这里我仅能先以甘耀明四本长篇为例解读数据:数据分析出Top 20的字词,共十九个名词与唯一一个动词「开车」。Top 20不是说甘耀明四本长篇的人总在开车,它说明的是「开车」这个动作,在四本小说的出现频率有被观察的必要。二十个词在四本小说是以函数的方式成为前二十名,「开车」在四本小说里头可能都不是出现最频繁的词。

那么读者应如何观察,观察什么?字词作为依据,我们能从「开车」按图索骥,先从题材与时空判断字词的适用性(比方《杀鬼》的「开车」仅出现两次),再找出每一本小说里头对应的段落跟脉络头对应的段落跟脉络,判断该字词是用以修辞、描述,或其他。这有助于我们厘清字词在文本之中的效果,如「士兵」一词在《冬将军》一书作为故事转述的名词,而《杀鬼》里头是「常见的」名词,且因为文本的时空背景,士兵不只是名词,它同时在故事里头也是「角色」与「修辞」,以其殖民政权的特性,成为构组《杀鬼》世界观的零件。

再如「资源」,这词是词频分析目前不足之处;在《冬将军》一书里出现七次,七次其实都是「资源回收」一词被截断后的数据。我们应从此转向分析「资源回收」一词在《冬将军》的效果,可是对照另外三本小说,就无法成立。

其他如「妳是」,除非第二人称小说,否则大概都在对话里,最极限地诠释它,也只能理解为甘耀明在小说里角色口吻的共性,可是这诠释不只没必要,且漏洞百出;或「兵」可能是「士兵」的删减、「爸爸」放在不同角色的口中或视角,至多也就表示甘耀明小说中必会出现的人物-家族构成──可是我们也很难在任一本小说中找不到「爸爸」。

简略操作下来,会发现统计的结果不一定能具体对应每部文本,且搜寻文本证据的过程非常费工;但这样的方式,已是现阶段文学文本分析一条精简的路。我们要留意的,不只是从数据对应文本找寻上下文,还有对重复用词词性构成的效果解读,并无一定标准。当我说连接词「或」构成「犹豫」的语气时,其他读者可能有相反感受,这就需要更准确的文本分析证据。就目前而言,仍须更细致的解读方法(文学或统计学方法?)才能更妥善解读数据。

总结来说,这项工程不只是辨析风格,若扩张对照组、分析项目,且方法化解读方式,它很有机会,能提供如文学史上语言转换(修辞、意象、句构或语法)这般规模问题的直接证据。

 


萧钧毅
一九八八年生,清大台文所博士生。曾获台北文学奖小说首奖、林荣三文学奖小说首奖等。作品入选九歌出版《一○四小说选》,电子书评刊物《秘密读者》编辑同仁之一。自己主攻小说书写与小说评论,研究则遥遥无期。

 

◆本文原刊载于《联合文学》第399期

0 comment

You may also like

发表意见

这个网站采用 Akismet 服务减少垃圾留言。进一步了解 Akismet 如何处理网站访客的留言资料