ChatGPT引起的反智症候群:別再說ChatGPT讓你毛骨悚然嚇到失眠了!

2023-03-03 11:00

? 人氣

很多人以為,微軟獲得GPT3授權、可用做搜尋引擎,就可以打敗Google,這又是另外一個誤解。因為搜尋引擎的「正確性」很重要,而當前這種語言模型產生的結果,錯誤機率並不低,這應該就是Google一直不敢大舉投入使用的原因;當Google看到微軟來勢洶洶,成功利用GPT3發展搜尋引擎New Bing,只好立刻推出自己的聊天機器人Bard,沒想到大家測試後發現回答有錯誤,讓Google母公司Alphabet股價一天內暴跌8%[5]。

[啟動LINE推播] 每日重大新聞通知

為什麼微軟的搜尋引擎Bing答錯了股價大漲,而Google的聊天機器人Bard答錯了股價卻大跌?因為Google是搜尋引擎的領導廠商,當市佔率97%的Google出錯了,使用者會給予很大的負評,而市佔率3%的微軟Bing出錯了,使用者會覺得沒什麼關係,至少它也有答對嘛!現在大家明白,為什麼台積電的3奈米製程要使用舊的鰭式場效電晶體(FinFET),而三星的3奈米卻敢使用新的環繞閘極場效電晶體(GAAFET)了吧!因為身為領導廠商,在科技發展的過程中,通常得更加謹慎小心。

語言模型如何預測一個句子的機率?

這裡我們使用「N元語法模型(N-gram model)」來說明這個概念。假設有一個句子:「元宵燈會即將在台北OO」,兩個空格一般人都會想到應該填入「舉行」,也就是當出現「元宵燈會即將在台北」,電腦能夠預測出在這句話後面出現「舉行」的機率最高。

➩當N=4,代表第i個字與前3個字有關稱為「四元語法(4-gram)」,例如:我們要找一個字讓P(W|在台北)的機率最高,這裡的P(W)代表第一個O機率。

➩假設電腦計算P(舉|在台北)的機率最高則輸出「元宵燈會即將在台北舉」,再繼續尋找下一個字讓P(W|台北舉)的機率最高,這裡的P(W)代表第二個O的機率。

➩假設電腦計算P(行|台北舉)的機率最高,代表下一個字是「行」 ,最後聊天機器人就輸出「元宵燈會即將在台北舉行」。

電腦計算機率的方式是使用「人工神經網路(ANN:Artificial Neural Network)」又稱為「類神經網路」,是一種模仿生物神經網路的結構和功能所產生的數學模型,用於對函式進行評估或近似運算,調整的參數稱為「權重(Weight)」,OpenAI推出的ChatGPT使用「GPT3.5模型」參數高達1,750億個,開始具備大型語言模型的商轉雛形。

ChatGPT的類神經元網路構造原理(圖片來源:http://www.hkpe.net/hkdsepe/human_body/neuron.htm)
ChatGPT的類神經元網路構造原理(圖片來源:http://www.hkpe.net/hkdsepe/human_body/neuron.htm)

大家聽到「人工神經網路」或「類神經網路」,以為是科學家用電腦來模擬人類大腦裡的神經元,其實這又是誤解。所謂「人工神經網路」或「類神經網路」,只是一種數學模型而已,只是因為它長得很像人類大腦裡的神經網路,所以資料科學家稱它為「人工神經網路」或「類神經網路」,事實上它只是一個數學模型,也就是演算法而已,和人類大腦裡的神經網路沒有關係。就好像大家都知道「類火車」就不是「火車」,因此「類神經網路」當然也和「神經網路」不是同一回事!

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章