打鐵匠演員不論表演得再怎麼讓人驚豔,他都不是真的知道怎麼打鐵。現在我們看到某些「專業」的遊客(寫程式專家),他本身不是打鐵專業人員(語言學專家),但是他有第一手的「打鐵表演觀賞經驗」,所以他把這些經驗寫成文章說:這些演員演得太好了,都說服我了,將來不需要真正的打鐵匠了,又給那些不曾去文化村裡看表演的人閱讀文章。
這些所謂的生成模型,不論是生成影像或語言,都可以「模仿人類的表現」,但是它沒有想法要表達,它也沒有任何動機。人類會知道「8 + 7 = 15」,是因為人類知道數學是怎麼運作的,所以人類是「因果邏輯驅動」的;語言生成模型回覆「8 + 7 = 15」是因為它覺得「8 + 7 = 」這四個符號之後,接上「15」這兩個符號的機率最高,所以電腦是「數據資料驅動」的,數據資料驅動的思維模式,並不是人類心智主要的運作方式。
我一直在思考,為什麼寫程式專家也中招,以為ChatGPT有感情與幽默感,分不出什麼是會思考、有意識,什麼又是數學演算法。後來我想通了!因為自然語言處理是跨領域的科學,它既然是「語言」模型,就必須了解「語言學」才行,如果只會寫程式是不夠的。就像我這樣腦袋硬梆梆的工程師,「我思故我在」對我們工程師來說是沒有任何意義的,所以「電腦會不會思考,和潛水艇會不會游泳是一樣的」,電腦科學大師的這句話,其實一點哲理都沒有,只表現出我們都是腦袋硬梆梆的工程師而已。
自然語言處理還有哪些實際的用處?
OpenAI公司除了推出聊天機器人ChatGPT,還推出其它模型,在日常生活或職場工作的應用更實際,主要包括下列模型:
➩以文產圖創造藝術:DALL-E模型可以經由輸入名詞讓人工智慧產出精美程度極高的圖像,已經能夠符合大眾的審美,如果把這個功能內建在微軟的Office軟體內,以後我們做簡報就不必自己辛苦的畫圖,可以輸入文字讓Powerpoint替我們產生圖片,再經由我們修改就可以了!是不是很方便呢?
➩以圖產文方便搜尋:CLIP模型可以經由輸入照片讓人工智慧產出對應的文字,例如「小狗在雪地裡玩耍」,我們平常出遊拍了許多照片都是依照日期儲存在電腦裡的,忽然有一天想要找某張照片又想不起來是哪一天拍的,這個時候可以直接以文字「小狗在雪地裡玩耍」進行搜尋,就可以找到所有小狗在雪地裡玩耍的照片了!是不是很方便呢?
➩創作音樂創新藝術:MuseNet與Jukebox模型可以依照使用者輸入的音樂,進一步融合不同風格增添樂器產出新音樂,讓音樂家修改成為創新的藝術。