《暢銷書密碼》選摘:電腦如何讀小說?

2016-12-23 05:40
書要暢銷不必求籤拜佛,電腦就能找出密碼。(風傳媒)
書要暢銷不必求籤拜佛,電腦就能找出密碼。(風傳媒)

電腦當然不會閱讀,至少和你閱讀的方式很不一樣。不過電腦可以用處理程式語言的方法讀書,它們先「看書」(也就是先接收資料),再把資料區分為人類所謂的意義單元,像是字母、標點、字詞、句子和章節等。所以電腦的確能模仿人類閱讀,而且訓練過程愈嚴謹,理解程度就愈擬真。而人類讀者和機器讀者的差別在於,人類知道他們閱讀的內容有意義。

話雖如此,電腦的閱讀方法卻能讓我們更接近小說描繪的細節,就連閱書無數的文評也甘拜下風。那是因為電腦擅長辨識模式,而且可以大規模處理模式和細節,但人類卻沒有辦法做到。

大家想想我們的研究初衷:暢銷書到底能不能預測?想做預測,就要先剖析過去重複發生的模式。除非你會占卜,否則預測未來靠的是熟悉歷史。一般來說,在字裡行間尋找有意義的模式是文評或學者的工作。著有《千面英雄》的神話學者坎伯,傾其一生研讀世界各地的故事,還刻意訓練他的眼睛去辨識這些故事的相似之處。他可是辨認模式的大師,儘管如此,一個人一輩子能做的終究有限,不論是閱讀的數量或觀察的細膩程度。辨認模式既要看微觀的細節,也要看宏觀的趨勢,而人類在這兩個面向都有規模上的限制。

但幾部經過訓練的電腦,可以在一天之內就讀完數千本小說,消化完數千筆資料,而且絲毫不放過人類可能會忽略或習以為常的各種細節。

舉個例子吧。我們在閱讀的時候,尤其是受過訓練、擅長捕捉細節的讀者,都會注意到作者使用了哪些形容詞。但我們大概不會注意到名詞和形容詞之間的比例,這個比例代表了作者有多常使用形容詞去描述一個名詞。電腦可以輕易找出這種資訊,讓我們更清楚作者的敘事方式與風格。電腦不僅可以縝密搜索,還可以比較這本書和另外上千本書的差異。如果電腦發現暢銷書裡形容詞與名詞的比例偏高或偏低,那這個寫作特徵就很重要了。

下次你找書來看的時候,不妨做個實驗,別管朋友的推薦也不要執著於熟悉的作者和類型,試著連續一週都只看《紐約時報》暢銷榜上的書。如果你讀得夠仔細,你就會變得有點像我們的電腦,不論是文學作品或大眾讀物、男性書籍或女性書籍、明星作家的小說或普立茲獎得獎作品,你都能開始看出各種書籍之間意外的共同模式。

有些模式可能會讓你很驚訝,譬如說,你會納悶為什麼女主角通常都是二十八歲。這重要嗎?你可能會問自己:如果一本小說長達400頁,作者是不是刻意把第一場床戲安排在第200頁?如果全書只有220頁,那第一場床戲則會落在第110頁。如果真是這樣,為什麼?你可能會和朋友討論,小說若有一個吸引人的開頭卻沒有一個讓人滿意的結局,銷量會不會受到影響?搞不好你還會覺得這些分屬不同類型的暢銷書有太多潛在的共同點了,根本可以自成一派。 (相關報導: 「講平凡事物的書,其實很迷人!」比爾蓋茲最愛不釋手的5本書,你看過幾本? 更多文章

《暢銷書密碼》的兩位作者。(雲夢千里出版提供)
《暢銷書密碼》的兩位作者。(雲夢千里出版提供)

有趣的是,讀者在不知不覺中對這些模式很有感覺。「文學神經科學」是一門新興的研究領域,學者利用核磁共振來掃描測試對象在閱讀時的腦部活動。這項認知心理學的研究是為了瞭解讀者閱讀的時候都在注意什麼。儘管這和我們的方法差很多,但兩種方法都認為,人類對讀物的反應來自於哪些字、用哪種方式排列、出現在哪些句子裡。是字句的組合觸發了讀者的反應。

因為你,我們得以前進,你的支持是我們的動力
更多文章
到日本你愛逛LOFT嗎?7款超可愛、貼心的熱賣文具,做足功課才不會失心瘋啊
觀點投書:新南向政策─瞄準產業,我們做對了嗎?
觀點投書:雞同鴨講的「中國人」
觀點投書:監理沙盒 讓金融市場將更加多元
觀點投書:共軍戰機歡迎光臨台灣
感冒頭痛、喉嚨痛一定要吃止痛藥?耳鼻喉科醫師:藥品廣告絕不會跟你說這件事!
李棟材宅拆除喊卡 文化部啟動古蹟審議程序
TVBS縣市長滿意度 傅崐萁奪冠、柯P倒數第二
預錄節目被NCC警告「造假」,吳淡如:沒常識到了極點
一例一休上路 量販業寒假遇挑戰、客運漲價8-40%
竹縣元旦健走 一起運動一萬步
俄羅斯:俄美對話已全部「凍結」 美國:沒這回事
因應貿易保護主義,彭淮南建議擴大國內基礎建設投資
保障勞工!勞工申請仲裁 勞動部將補助律師費
「今年是國民黨洪憲元年」?前國民黨青年幹部批:5個人就能通過選舉期程
立院初審通過追討黨職併公職溢領退休金,胡志強溢領恐討回
看好景氣上升 明年第一季52.4%企業擬加薪
首位白宮國家貿易委員會主任 反中國、挺台灣的納瓦羅是何方神聖?
直播殘酷戰火的小女孩「敘利亞的安妮.法蘭克」平安逃出阿勒坡
聖多美斷交事件 謝志偉:不怕對台理光頭,只憂內部鬼剃頭
預防失能 長照2.0將推廣「四輪傳動」 首年將嘉惠15萬人次
年金改革版本出爐:18趴分期調整、軍公教所得替代率70%