AI數據「資料標註員」工作內容有什麼?從ChatGPT到抖音內容訓練,一窺隱藏在數據的底層勞動力真相

2025-01-31 09:40
2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(資料照/美聯社)
2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(資料照/美聯社)

編按:從ChatGPT等AI聊天機器人產生的熱門內容,到TikTok、Instagram和YouTube的內容,其實,都是由所謂的「資料處理員」的協助進行整理、標記和分類。不過作者指出,「資料標記工作訓練了AI系統,但AI系統最終將取代訓練它的人類」。

機器中的靈魂

試圖打造出超乎常人的智慧機器並不是什麼新鮮事。在十九至二十世紀之交,猶太人的民間傳說描述過十六世紀末有「魔像」(golem)出現,它原本是泥偶,由布拉格的拉比勒夫(Rabbi Loew)賦予生命,保護當地猶太人不受反猶人士的攻擊。

故事的結局很好預測,魔像抓狂,最後毀在創造者手裡。這個故事和兩樣事物遙相呼應:一是雪萊(Mary Shelley)的創作《科學怪人》(Frankenstein),這部近代的作品協助催生了科幻小說文類;另一是最近新聞熱潮的AI論述,人們似乎愈來愈擔心惡意AI帶來的危險

今天,真實世界的AI沒那麼有自主性,反而更像一種輔助技術。大概從2009年開始,我們密集使用連網設備和網際網路產生的大量資料,加上不斷增強的晶片運算能力,促成技術突飛猛進。

值得一提的是,這導致了一個AI子類別的興起,那就是機器學習及衍生的深度學習(deep learning),兩者都在教電腦軟體從大量資料中找出統計的相關性,範圍涵蓋文字、影像、程式碼或數字。

找出模式的方法之一是讓AI模型看過數百萬個標記好的範例。這種方法需要人類費心標記所有的資料,這樣電腦才能夠進行分析。沒有這些負責標記的人,做為自動駕駛車和臉部辨識基礎的演算法就與目盲無異,它們沒辦法學習模式。

以這種方式打造的演算法,如今能在醫學、刑事司法、社會福利,以及抵押貸款申請等諸多領域,強化或替代人類的判斷。生成式AI是最新一代的AI軟體,可以產生文字、程式碼和影像。這讓它們能化身為創意助理,協助教師、財務顧問、律師、藝術家和程式設計師共同製作原創的作品。

為了打造AI,矽谷最有名的公司都在自家腹地爭取名額有限的資訊科學人才,支付數十萬美元給剛出爐的博士。

但要利用真實世界的資料來訓練和配置AI,同樣的企業卻找上薩碼這類公司,這類公司擁有的一大票員工具備基本的數位素養,薪資卻不高,且就業狀況不穩定。

薩碼不是全球唯一提供AI訓練服務的公司。Scale AI、Mighty AI(現歸優步所有)、澳鵬(Appen)、蜂巢微(Hive Micro)和艾美瑞特(iMerit)等新創公司,以及埃森哲(Accenture)和威普羅(Wipro)等較傳統的資訊科技公司,都是這個不斷壯大產業的一部分,據估計到了2030年,這份產業的價值將達到一百七十億美元。

AI供應鏈中的寶貴人力

因為AI公司需要標記的資料量實在太大,多數新創公司都把服務外包給收入較低的國家,在這些地方有許多像寇利和恩吉托這樣的工人,能雇來篩選和詮釋資料,以便訓練AI系統。 (相關報導: 不是學歷、證照!職場上擁有什麼才能脫穎而出?專家給答案:裝不出來也騙不了人 更多文章

逃離家園的敘利亞醫師訓練的醫療軟體能協助英國醫師診斷前列腺癌;在經濟衰退嚴重的委內瑞拉,失業的大學畢業生幫電子商務網站分類流行商品;在加爾各答貧窮的穆斯林社區梅蒂亞布魯茲(Metiabruz),赤貧的婦女幫亞馬遜智慧型喇叭的語音片段加上標記。他們的工作揭露了一個幾乎眾人皆知的祕密:所謂的人工智慧系統無法獨立「學習」,這項技術的驅動需要人類,而且是數百萬名的人類在全球的AI供應鏈裡,資料處理員是寶貴的人力環節

因為你,我們得以前進,你的支持是我們的動力
更多文章
古代沒有保險套怎麼避孕?3大奇葩方式揭曉!原來套套最初是用這1種東西做的
2025桃園中原夜市美食推薦》10間必吃清單!香腸炒米腸、鹹酥雞起司紅豆餅,錯過可惜了
保費繳多年,丈夫過世妻子卻領不到理賠金!專家曝保險忽略1件事,財產全進他人口袋
華府空難悲劇》「我們沒能救出任何人」去年就有8次空中碰撞,雷根國家機場有何安全隱患
天氣預報》大年初三回暖了!這天起轉濕冷「恐有強烈大陸冷氣團」 下週天氣一次看
咖啡渣、果皮是廚餘還是一般垃圾?環保局曝正確分類,小心丟錯罰6000元
不是鮭魚鯖魚!農業部推1種好魚「蛋白質含量比牛肉高」,富含Omega-3降三高
劍湖山、古坑輸了!雲林最強景點是「它」狂吸943萬人,遊客讚:美食眾多值得一訪
「我和他相處得很好,他是個聰明人!」川普又想見「老朋友」金正恩,這次他能如願嗎
小耳朵》女生間的秘密!立法院打架時貼身保護韓國瑜 源自閨蜜的一場談話
《黑箱日記》揭露日本之恥!女記者遭電視台高層殘忍性侵,伊藤詩織挑戰社會禁忌曝光真相
為何鼎泰豐幾乎都開在百貨公司裡面?會計師曝3大關鍵,利潤不高照樣賺進百億營收
為何愛玉靠搓洗就會「結凍凝固」?台灣國民美食的背後原理,竟然可以控制結膠程度
華府空難悲劇》川普指責「多元、公平及包容」政策成飛安漏洞,點名前同志運輸部長是「大贏家」
戰爭結束80年,當初的南太平洋樂園如何變成今天的帛琉?
每月定期定額存股,不代表可以提早財富自由!專家用2檔高股息ETF試算:只是美好錯覺
牙刷該選軟毛還是硬毛?電動牙刷有用嗎?牙醫師曝4大挑選秘訣,選這種刷得乾淨又不傷牙齦
「中國停止侵略脅迫,我們就把飛彈還給美國!」小馬可仕談堤豐:中國的飛彈比我們強上千倍,我們也不曾發表意見
過年到底該誰洗碗?一個美國女人的偉大發明,徹底打破上千年來的家事規則
不是科幻電影劇情!「無訊號」也能用手機連結衛星打視訊電話,歐洲最快年底就能體驗
阿將伊崮喜瀾觀點:AI競賽啟示錄—吹牛冠軍VS.豬虎策略
呂政璋觀點:真假AI革命─中國DeepSeek挑戰美國科技霸權的背後
張光球觀點:巴西不甩川普,為「帶頭」再「帶路」
張哲銘觀點:從軍中爆發退職潮看國軍招募人員的困境
鄭宗記觀點:正視以偏概全的民調報導
李照興專文:因為害怕失去更要記得─當香港流行變成一種身分
黃于洋專文:我在塞內加爾,買了一瓶洗髮精
觀點投書:政府補助公視23億是小錢?真的不食人間煙火 !
觀點投書:中德經濟依賴與統戰博弈─擺脫困境還是重蹈覆轍?
丘彥明專文:世界上最小的瓜
觀點投書:臺灣拋橄欖枝,觀光回歸非政治化
觀點投書:穀物與國家,誰才是人類文明的主宰?
過年拜拜必見「旺來」 檔案局揭密台灣鳳梨黃金歲月 熱賣到向美國要援助
中共歷代領導人中就這兩位屬蛇 習近平仿效「偶像」毛澤東意識形態治國
軍艦也如同汽車要保養 定期「大修、小修」有區別 確保戰力不生鏽
尋獲30具遺體:美航龐巴迪客機與黑鷹在華府空中相撞墜毀,警消判定「兩機67人」恐無人生還
沒承認做錯事!川普不滿臉書粉專被停用提告,Meta支付8.2億與新總統和解
收藏玩家搶購!「秋爽」用愛畫出萌寵年味 創業後盾雄挺利
2025台北燈節「開運光廊」 四大展區東西串聯 捷運輕鬆賞燈去
國漫館「漫畫行春」 三大主題活動 陪你過新年
侯友宜初二發寵物小福袋 淡水紅毛城變成「毛孩城」
鍾明軒反擊八炯「要他公開未剪輯影片」!她一看「這4字」秒傻眼:不是入黨了吧?
封禁川普帳號的代價太昂貴!Meta為與川普言和 付上億「天價和解金」
OpenAI開戰DeepSeek偷技術 專家卻曝「這美企」才是最大贏家:大家皆大歡喜
美國零食大牌「緊急回收知名洋芋片」!原因曝光「恐危急生命」 食藥署發聲了
有沒有對象啊?過年最怕長輩「6大靈魂拷問」 第1名這話題網友全崩潰
今5.6餘震已是嘉南「第三波高峰」!專家示警震央有異變:範圍正在擴大
簽約至今等了5年!耗資近30億美元,保加利亞空軍將迎接第一架F-16V戰機
真的不怕死?屁孩小年夜「人孔蓋上點鞭炮」! 把自己炸飛「3秒才落地」影片瘋傳