當下AI的真正挑戰,早已不只是模型夠不夠聰明,而是能不能在真實世界裡穩定運作。當AI開始離開螢幕,走進工廠、倉儲、能源設施與巡檢現場,它要面對的就不只是算力,而是感知、移動、即時判斷與穩定連線的整體工程。Moxa與所羅門6日同台對談,試圖拆解這個關鍵問題:從AGV到無人機,AI實體化到底如何真正落地,而支撐這一切運作的底層骨幹,又是什麼。
Moxa台灣區負責人劉孟迪表示,若把時間拉回2022年底,OpenAI推出ChatGPT後,生成式AI迅速掀起全球浪潮;但到了今天,AI的關鍵已不只是生成內容,而是正從數位世界跨入實體世界。他形容,今年可明顯看見,AI正「從螢幕走到現實世界」,從原本的數位生成,進一步走向實體感知與現場部署。
大量的影像、視訊串流湧入現場
這也代表,企業現場要處理的資料型態,正在發生根本變化。劉孟迪指出,過去工廠主要整合的是機台資料、感測器資料與各式系統數據,但隨著AI實體化加速,接下來湧入現場的將不只是IoT資料,還包括大量的影像、視訊串流與來自多元終端設備的感知資訊。換句話說,工業場域未來要整合的,已不只是Data,而是Data加上Video Streaming的複合型流量。
也正因如此,AI實體化的第一步,其實不是讓機器會「做」,而是先讓它會「看」。工業自動化大廠所羅門資深協理鍾毓修表示,很多人以為所羅門在做的是機器人,但更核心的其實是軟體平台與AI視覺技術,讓機械手臂、機器設備、相機、攝影機與各種終端,都能擁有「眼睛與腦筋」,進而完成辨識、判斷與執行。
他回顧,所羅門投入AI已逾十年,早期主要協助機械手臂進行搬運、取放與引導,現在則已進一步延伸到輪式機器人、雙足機器人、穿戴式設備、AI眼鏡、手機、平板、IP Camera、Webcam,甚至無人機等多元載具。對鍾毓修來說,只要設備能取得影像,就有機會透過AI進入辨識、感知與決策流程。
這類應用其實已不只發生在製造業。鍾毓修舉例,在物流倉儲場域,AI視覺可協助機械手臂面對大小、形狀各異的商品盒,完成取料、掃碼、貼標與分揀,再依據門市需求進行自動補貨;在餐飲場景中,也能透過影像辨識與錄影確認外送訂單包裝流程,降低送錯、漏送造成的損失;在巡檢場域,AI可協助讀表、辨識燈號、判讀旋鈕狀態,甚至驗證保潔與巡查流程是否真的有完成。
AI實體化已經在現場陸續發生
更進一步的案例,則已走向能源場域。鍾毓修指出,無人機如今可以搭配AI視覺技術,在太陽能場域執行巡檢任務,辨識面板是否有髒污、遮蔽或異常,再通知地面人員前往處理,以提升發電效率。這些案例共同說明一件事:AI實體化不是遙遠概念,而是已經在製造、物流、零售、餐飲與能源現場陸續發生。
但AI設備有了「眼睛」與「大腦」之後,真正決定它能否穩定運作的,往往是最容易被忽略的基礎層。劉孟迪直言,在AI實體化時代,網路已不再只是控制或監控的後端支援,而是整個系統的「數位神經」。尤其當AGV掛上IP Camera開始巡檢,或無人機持續回傳高畫質影像,若資料必須等一兩個小時才回到中控室,很多決策其實都已錯過黃金時間。
他指出,工業無線網路的難度就在於它「看不見、難查修」。有線網路出了問題,多半就是設備或線材;但無線環境可能同時受到電磁干擾、頻段使用、設備位置、場域結構、漫遊切換與現場障礙影響,因此挑戰遠比一般人想像更高。也因此,Moxa長年投入的,不只是把設備做出來,而是想辦法讓無線也能做到接近有線的穩定、精準與可控。
劉孟迪進一步說明,不同場景對網路能力的要求也截然不同。例如巡檢型設備或移動式視覺系統,需要的是Wi-Fi 6、Wi-Fi 7這類高頻寬、低延遲能力,以便不間斷回傳高畫質影像;若是協作型機器人,則更在意動作指令是否能精準到達,因此會牽涉到TSN(Time Sensitive Network)等新技術;至於大型倉儲或跨樓層移動的AGV、AMR場景,則可能需要Wi-Fi搭配5G專網混合部署,才能把死角、漫遊與中斷風險降到最低。
智慧工廠的核心架構被重新定義
這種整合,也重新定義了智慧工廠的核心架構。劉孟迪認為,未來工廠不會再只是固定式產線,而會朝更靈活的細胞式生產演進;品檢也不再只在成品端執行,而會逐步走向全時、即時的監控與判斷。當AI視覺與可靠網通形成完整閉環,數位孿生才有機會從概念變成真正可運行的現場能力。
鍾毓修則從另一個角度補充,當前機器視覺的成熟度,其實比人形機器人的手腳控制能力更往前一步。因為視覺可以放大、縮小、遠看、近看,在某些場景下甚至已經超越人眼。真正還有待突破的,不只是看見,而是如何把看見之後的語意理解、動作控制與場域移動串成完整任務。這也是為什麼近來VLM、VLA等技術受到高度關注,因為未來機器若要進入家庭與更複雜的應用現場,不只要知道「眼前這是什麼」,還要知道「接下來該怎麼做」。
他舉例說,人走進便利商店買水時,不會一開始就盯著瓶身辨識品牌,而是先用遠端視覺快速定位可能的區域,再走近判斷細節、確認品項與價格。這種「先搜尋、再接近、再執行」的能力,才是真正讓具身智慧落地的關鍵。若少了這一層,機器即使具備強大模型,也可能在真實世界裡繞許多冤枉路。
從AGV到無人機,從巡檢到分揀,從工廠到能源場域,AI已經逐漸離開展示台,走進真正需要效率、即時反應與穩定運作的地方。所羅門負責的是讓設備具備視覺與判斷能力;Moxa補上的,則是讓這些設備之間的資料、指令與協作可以穩定流動。當AI不只是「會算」,而是必須「會看、會動、會連」,智慧工廠的新骨幹,也就不再只是單一設備,而是一整套由感知、運算與工業網通共同構成的神經系統。
更多風傳媒獨家新聞:














































