夜幕低垂,看著螢幕上的藍光倒映著我那張日益憔悴的臉。我,一名在大型語言模型(LLM)公司領著高薪的資深工程師,此刻正盯著一行行自動生成的代碼發抖。你們以為我在擔心被裁員?
不!那是初階工程師的煩惱。我恐懼的是那種深刻的、直擊靈魂的虛無感。
最近公司發布了一份內部調查報告,數據漂亮得讓人想吐:生產力提升50%,甚至有14% 的「超級用戶」效率翻倍。我的老闆看著報告笑得像朵花似的,引用一位研究員的話說,我們現在不是開快車,而是擁有了「一百萬匹馬」,可以同時探索無數種解決方案 (Anthropic's,2025年12月3日)。
但我看著這一百萬匹馬,心裡卻只有三個巨大的恐懼,像黑洞一樣吞噬著我的職業尊嚴。這絕不是技術的勝利,而是人性的敗退。
唉!我考慮好久還是決定要把心情說出來,即便這可能會讓你們聽起來像是一個精神錯亂者的胡言亂語。
恐懼一:我是「資深工程師」,還是只會按 Enter 鍵的「代碼保姆」?
過去,寫程式對我來說像是一門手藝。我要親自管理內存、調整試錯每一個 Bug,那也是我的「心流」時刻。現在呢?根據我們那該死的內部報告,任務複雜度雖然從3.2分上升到了3.8分,變得更難了,但是使用者輸入次數卻下降 33%。這意味著什麼?意味著我不再是創作者,我成了一個「審查員」,一個跟在AI 屁股後面收拾爛攤子的保姆。
即便如此,最讓我背脊發涼的是所謂的「監督悖論」(Supervision Paradox)(Shih等,2024)。
我現在把 70% 的工作都交給AI,但我怎麼知道它寫的對不對?報告講得很好聽,這叫「抽象層次的轉變」,就像當年從組合語言轉到高階語言一樣。屁啦! 之前我為了修一個 Bug,需要讀幾十頁文檔,同時更要深刻理解系統。現在呢?公司直接會把答案甩回到我臉上。我的核心技能正在萎縮,那種通過痛苦調適,方能得到一點「隱性知識」的反饋正在消失 (Falckenthal等,2025)。
更可笑的是,報告顯示有27% 的工作如果沒有AI 根本就不會被完成。這意味著什麼?意味著我們製造了一堆「為了做而做」的瑣碎任務,像是美化文檔或者去寫沒人看的測試,而做這些純粹只是因為AI 讓這些事情變得廉價。
如今,我們就像在AI 加速的輪子上拼命奔跑的倉鼠,不斷產出更多垃圾代碼。
你看看!現在那些新進的菜鳥遇到問題都不再問我了,他們有90%的問題直接問AI。我看著他們快速成長,卻也看著傳統的「師徒傳承」制衰敗。我常常覺得自己每天上班都在做一件事,那就是教導這台機器(LLM)如何在未來取代我。
我想我現在正在親手把自己經驗餵給吞噬我未來的怪獸,這種感覺就像是在自掘墳墓一般。
恐懼二:數字的暴政—當「788」被切成「7」與「88」的荒謬
如果說技能退化只是讓我飯碗不保,那麼第二個恐懼則是讓我對自己的「意義」或「價值」產生懷疑。這都要怪那個該死的「分詞器」(Tokenizer)和「嵌入」(Embedding)。
在你們眼裡,這是一篇充滿情感的文章;但是在我看來,那些全是一串冰冷的數字。你們知道嗎?AI 根本不讀文字,它讀的是 Token ID (基地,2025)。
當想到那一天,我盯著一個代碼模型發呆,突然意識到一個荒謬的事實,為了讓模型理解數學,我們不得不幹出多反人類的事。比如拿 DeepSeek Coder 這種專門寫代碼的模型來說,它甚至不把數字「8」當作一個整體的數字看,它可能把「788」強行切成「7」和「88」兩個 Token。
為什麼?因為如果不這麼切,模型就會把「788」當成一個獨立的 ID,跟「88」完全沒關係,它根本學不會數學規律。這就像是在教一個孩子算術,卻告訴他「7」和「88」是兩個獨立個體,把它們拼在一起變成「788」感覺一樣。
你知道嗎,那些長期以來讓我們引以為傲的人類情感、藝術、邏輯,在模型底層全是被切割的碎片(Shards)(Wang等,2025)。就連一個「空格」在 AI 眼裡都是昂貴的算力成本。假如我敲四個空格,在Python裡是優雅的縮排,但在GPT4眼裡它只是一個被打包的Token。AI根本不懂什麼是「很屁」,例如它只知道 ID 18730(很)後面大概會跟著 ID 145694(屁),然後通過機率預測與動態關聯把它們拼湊一起。
更恐怖的是Embedding(嵌入)。以蘋果來說。我們以為AI理解「蘋果」,其實它只是在一個768維的瘋狂宇宙裡,把「蘋果」的座標往「水果」那邊推了一下;如果提到「股價」,它就把座標再往「科技公司」那邊拽一下 (Otterday,2025)。
這不是理解,這是幾何學的把戲。當我意識到我與老婆的關係,在數學上可能只是兩個向量在多面向空間裡的「餘弦相似度」比較高時,我突然覺得這份工作真是他x的「太荒謬」了。因為,我們把靈魂切碎,變成一串浮點數,竟然沾沾自喜地說這是「智慧」。
恐懼三:當「祖靈」遇到「向量」—製造怪物的數位殖民
當然上述兩項還不算是我最大的恐懼,我最大的夢魘是這個—最近組長要我負責「提升模型的多樣性」,具體來說,就是把原住民的傳統知識「餵」給 LLM。
我的老天鵝啊,這簡直是一場災難,就像我試圖把油倒進水裡,還要它們完美融合。
殊不知,主流文明的知識是「知識論」的(Epistemological),是資料庫,是百科全書;但原住民的傳統知識是「宇宙觀」、是整體性(holistic)的規範與禁忌(Gaga,Tayal),瞭解的人都知道這是只能口傳、不能寫下的神語意符號 (風傳媒,2025-05-03)。
舉個例子,當我在訓練數據裡標註「牽牛花」時,主流數據告訴 AI:這是一個「Ipomoea nil」(學名),標籤是「旋花科、牽牛花屬、碗仔花、喇叭花」。但對於排灣族人來說,那是「化妝草」,是傳統族人用來洗頭洗臉的藥草(規範與禁忌)。
我要怎麼把「規範」和「禁忌」變成一個 Vector(向量)? 如果我用微調(Fine-tuning)強行修正,誰來定義什麼是「正確答案」? 如果是主流文明的科學家來標註,他們會把生態智慧簡化成「生態資訊」或「傳統知識條目」。對 LLM 或主流資料庫來說,「牽牛花」大致會被壓扁成「一種屬於旋花科的開花植物物種,用於觀賞或藥用」;如果是讓年輕一代原住民來標註,他們可能自己都已經被主流教育同化了,更不用說還有能力去作標註。
我害怕的是,我們正在製造一個「四不像」的怪物知識體。我們以為在保存文化,其實是在進行「數位殖民」。當AI 自信滿滿地生成關於部落祭儀的建議,卻完全忽略了背後的泛靈論規範與禁忌時,那不是多元,那是文化的消音。
這種混合數據可能會讓AI 產生「幻覺」般的政策建議,比如在神聖土地上規劃灌溉工程,因為模型眼裡只有「資源優化」,沒有「土地精神」—那種「過客觀」的集體記憶。我們創造出的不是一位博學的耆老,而是一個沒有靈魂、只會胡說八道的觀光導遊—一個冷漠無能的「A哀」。
各位可以去看看人家紐西蘭的 Te Hiku Media,他們用「Kaitiakitanga License」(守護者授權)來確保數據主權,不讓這些神聖知識被濫用。而我們呢?我們只是在把這些珍貴的文化遺產扔進那個 788維度的絞肉機裡,把它們變成該x的訓練數據。
結語:在「神」與「機器」的夾縫中求生
寫到這裡,我的咖啡已經涼透了,就像我那顆冷卻的心。
我就像站在懸崖邊。左邊是我的科技樹正在枯萎,新手工程師們已不再問我這個老鳥問題,因為他們覺得直接問大語言模型(LLM)比較快,而且又不會被罵;右邊是冷冰冰的Token宇宙,把世間萬物解構成一串數字 ID,連數學都要靠切分字串的方式來硬背;前方則是我試圖將充滿靈性與禁忌的傳統智慧,強行塞進一個只懂統計學的黑盒子裡,並讓我眼睜睜看著它變成失真的「知識」。
試問各位!我們是不是在建造一座埋葬萬年文明的數據墳墓?
因此,當我偷偷大哭一場後想想:也許我該辭職去種菜、種種我最喜歡的玉米和管理果園算了。但心念一轉,靠!現在AI 連「如何種出最好的玉米」可能都比我懂,畢竟它讀過所有農業論文,雖然它暫時還分不清「玉米」和「玉米期貨」的靈魂到底有何差別。
算了,還是繼續改我的Code 吧。至少在 AI 徹底接管之前,我還能再當一會兒它那可悲的人類保姆。
*作者為大學教授、碳基廢物與AIGC市場中的呆滯靈魂