葉日武觀點:從林智堅論文抄襲案,談竹科45萬元買來的垃圾

2022-07-12 07:00

? 人氣

新竹市長林智堅(見圖)被指控論文抄襲後風波不斷。(資料照,顏麟宇攝)

新竹市長林智堅(見圖)被指控論文抄襲後風波不斷。(資料照,顏麟宇攝)

林智堅論文抄襲案堪稱是「另一個台灣奇蹟」,即使鐵證如山──例如第1頁內文只是第1段開頭的「新竹科學工業園區」改為「該科學工業園區」,第4段開頭的「科學工業園區」前添加「該」字,其他都一模一樣,連「籃球」誤植為「藍球」都照抄──綠營大咖仍然護犢心切硬拗,顯然自信滿滿,認為多數民眾也會因為對綠營護犢心切,最後選擇讓自己的良心給狗吃掉。

[啟動LINE推播] 每日重大新聞通知

目前這個抄襲案已經鬧上法院,同時也迫使竹科管理局和兩所大學必須有所表示。或許幾個月後,我們就能夠知道這4個機構到底是不是民進黨開的,同時也能夠知道這幾個機構的主事者到底還有沒有良心。

這些都是後話,本文所要討論的是那份45萬元買來的垃圾…沒錯,就是垃圾。雖然竹科管理局並未公開那份由中華大學提交的報告,但台北市議員王鴻薇已經指出,林智堅的論文和那份報告有88%完全相同,還有6%是從《品質月刊》的論文複製而來,因此在無法取得該研究報告之下,我將林智堅的論文視為該研究報告的複製品來進行評估,而我的評估結果就是「對竹科管理局毫無用處的垃圾」!

那是診斷研究,不是學術研究耶!

跟據媒體報導,竹科管理局指出「為瞭解竹科周邊居民觀感,打造與環境共榮共好的關係」,才委託中華大學進行該項研究。因此,這應該是一個協助竹科管理局瞭解周邊居民觀感,決定是否要設法改善和如何改善的診斷研究(diagnostic study),而不是一個想要增進人類知識的學術研究(academic research)。

那麼,實際研究成果究竟如何?王鴻薇比對後發現「結論與建議也幾乎全抄」,因此先看看這兩個部分的重點,如表1。

林智堅論文結論與建議部分的重點(作者葉日武提供)
林智堅論文結論與建議部分的重點(作者葉日武提供)

顯然,在5點結論當中,除了第5點告訴竹科管理局民眾滿意度很高之外,其他4點都不屬於民眾滿意度的範疇。換言之,竹科管理局花了45萬,只知道民眾的滿意度很高,但究竟是哪些地方滿意,哪些地方不滿意,卻是毫無頭緒。試問,竹科管理局應該如何嘗試「進一步改善竹科周邊居民觀感,打造更完美的共榮共好關係」?

而純粹就「民眾滿意度很高」這點而言,如果竹科管理局想要調查的話,其實改為委託民調或行銷顧問公司,不難在一個星期內交件,而不是實際上耗費的6個月,並且通常可以議價到10萬元以下,而不是實際上花費的45萬元…想要知道「哪些地方滿意,哪些地方不滿意」的話可能要加碼,但絕對不會離譜到45萬的地步。

至於建議中的兩點對於竹科管理局更是毫無意義。第1點居然是要求政府(對象應該是經濟部)成立相關機構或出資補助台灣顧客滿意指標(TCSI)模式相關研究,在該模式為中華大學教師所建構完成之下,等於是要求政府花錢推廣該校的研究產出。第2點就不用提了,任何重視顧客滿意度的企業或其他機構,都會把相關調查納入內部運作規範,例如台鐵是「每天在做,每月彙整」,而大潤發是在農曆過年前印發一本涵蓋各方面的小冊子請顧客填寫。

關鍵在於,既然林智堅的論文和竹科管理局委外研究報告有88%重複,那麼該報告必定也是脫離診斷研究的常軌,不理會委託單位的需求,完全依循學術研究的慣例。換言之,竹科管理局花了45萬元,只是為了支持一項著眼於學術發展,對自己沒什麼參考價值的學術研究。

這就讓我納悶了。既然是竹科管理局發包的研究案,必定有多個團隊參加投標,而且決議前必定要提出研究計畫並進行簡報,最後由多位學者專家獨立評分並擇優錄用,研究完成後同樣還是要提出研究計畫並進行簡報,並由多位學者專家審查其內容是否符合要求。那麼,是因為其他競標團隊爛到不忍卒睹,還是那些擔任評審的學者專家都有眼無珠,搞不清楚診斷研究與學術研究的差別,才會讓竹科管理局花了45萬買到一份垃圾?

答案呼之欲出,「有人的地方就有江湖」,稍具社會經驗的成人,或在校期間曾經擔任學生會幹部的青年,都很清楚這其中的彎彎繞繞,不需要我饒舌了。

問題百出的理論模式!

用公帑資助學術研究並沒有錯,電影《侏儸紀公園(Jurassic Park)》第一集的開場片段,點出了缺乏商業價值的學術研究在資金上的窘迫。但問題在於,公開資助是一回事,審查過程變成純粹的「走流程」是另一回事,因為從林智堅的論文不難看出,那份研究報告不但在理論架構上問題百出,在研究設計與資料分析上也是千瘡百孔,正常情況下應該視為「不合格,應予退件」的學術論文。

說穿了,林智堅的論文其實是在「驗證TCSI模式對竹科管理局的適用性」,用學術名詞來說就是一篇複現(replication)或外部效度(external validity)研究,據以確認TCSI模式能否應用在竹科管理局這個特定的場域或脈絡當中…其目的是為了確認特定理論或模式是否具備「四海皆準,百世不易」的特徵,而不是只適用於特定的時空環境。

TCSI模式有3個版本,分別針對製造業、服務業、和政府與其他非營利組織,圖1是針對政府與其他非營利組織的部分…林智堅的論文直接轉貼《品質月刊》當中的英文原圖,我將之全部譯成中文。圖中的橢圓形代表該模式所涵蓋的構念(construct,意指不像身高體重那樣可以客觀測量的事物),沒有加框的文字代表個別構念所涵蓋的構面或向度(dimension),這兩者以白色短線連結,而黃色箭頭則顯示了各個構念之間的因果關係。

TCSI模式:政府與非營利組織(作者葉日武提供)
TCSI模式:政府與非營利組織(作者葉日武提供)

光是這個理論模式,吐槽點就太多了,例如期望和認知兩構念為何選擇歐洲學者那只有理論性探討,沒有進入實證階段的整體、功能、與技術3分法,而且還把原本的功能與技術共同影響整體變成3者比肩?為何不採用更具權威性與普遍性,原本就納入期望與認知的SERVQUAL模式?但這類問題是可以討論的(debatable),只能證明該研究在文獻回顧上確有重大疏失。

本文只提出兩個致命疏失。其一,各國的顧客滿意指標模式,在顧客滿意部分都是使用整體滿意度,但TCSI的原創者卻另行納入期望實現(fulfillment of expectation)和理想比較(comparison with ideal)。這是原創者對既有文獻理解錯誤的鐵證…早期的顧客滿意研究採用失驗典範(disconfirmation paradigm),用「失驗」這個構念來代表期望與認知的落差,但其他學者另行提出期望實現和理想比較的論點,認為可以代替失驗典範。因此,整體滿意度、期望實現、和理想比較3者根本就是不同的東西,後二者可以加上失驗後3選1,但不論如何選擇,最後都要將之視為影響整體滿意的前因構念(antecedent),而不是像圖1一樣的和整體滿意比肩。

其二,在《品質月刊》的英文原圖當中,構念和構面之間的關係就是和題1一樣用直線表示,但個別構面顯然不應該用單一題項或其他單一指標來測量,因此想要對TCSI模式進行實證,其測量模式(measurement model)就必須包括6個二階模式(second-order model),而且必須澄清每個二階模式的性質…到底是由下而上建構出來的形成性模式(formative model),由上而下反映出構念實際水準的反映性模式(reflective model),還是兩者兼有的混合模式(mixed model),如圖2 (圖中顯示3題只是學界常用的「下限」,並非一定要使用3題)。

20220708-3種二階構念測量模式的比較(作者葉日武提供)
3種二階構念測量模式的比較(作者葉日武提供)

舉例而言,圖1當中的「形象」有4個構面,以其中的「口碑」和「過去經驗」而言,你知道輿論對竹科讚譽有加,但你實際拜訪竹科的經驗必定是順利愉快的嗎?既然口碑和過去經驗大致獨立,那麼形象和這兩個構念之間的關係就應該屬於形成性模式,而非都是反映心中既有的印象,於是「一榮皆榮,一損皆損」的反映性模式。

該研究的資料分析過程顯示TCSI採用反映性模式,而且將6個構念都視為一階(first-order),但完全沒有提示其依據為何,而學界早就知道測量模式界定錯誤可能會導致分析結果嚴重偏離事實。

千瘡百孔的資料分析

上述的構念及其測量都屬於理論層面,但即使只是針對研究設計與資料分析,並且以「不會笑死人」當做合格標準,那篇研究報告也是不及格。同樣的,吐槽點太多了,我只提示資料分析方面的3點…研究設計部分在把「二階構念」當成「一階構念」來處理時,就已經病入膏肓,宣告沒救了。

其一,任何構念的測量工具都必須通過信度與效度的考驗。信度(reliability)是指測量結果的一致性和穩定性,效度(validity)是指能否確實測出想要測量的事物,兩者都有許多形式與名稱各不相同的估計方法。該研究用Cronbach’s Alpha檢測信度,這點可以唬弄一般研究生,卻逃不過學者專家的法眼…既然要用結構方程模式(structural equation modeling; SEM)來分析資料,那麼唯一的抉擇就是針對測量模式,用驗證性因素分析(confirmative factor analysis; CFA)跑出各種信效度資料,包括組合(composite)信度、收斂(convergent)效度、區隔(discriminant)效度、和結構或因素(structural or factorial)效度等等,但該研究完全沒有提供這方面的資料。

其二,該研究只提示每一題的平均數,但典型的碩士論文都會同時提示每一題的平均數與標準差,診斷研究更是不可或缺,因為後者可以讓讀者瞭解到,受訪民眾究竟是看法高度一致還是彼此分歧很大。再者,該研究提示了樣本結構之後,就直接跳到TCSI模式的統計驗證上,但典型的碩士論文和診斷研究中,還會另行跟據個人特徵,針對題項、構面、或構念跑平均數差異檢定或單因子變異數分析,因為讀者可以藉此知道究竟是哪些人比較滿意或不滿意,評價高或評價低等等,例如女性滿意度高於男性,或教育程度較高者認知品質評價較高。

其三,跑完SEM而且配適度達到學界能夠接受的水準之後,還要看看參數估計結果是否合理。以該研究整體模式跑出的參數而言,從認知價值到顧客滿意再到信任的兩個路徑係數都超過0.9,代表受訪民眾其實根本分不清楚哪個是哪個,用學術語言來說就是「區隔效度不足,資料缺乏分析價值」,硬要分析的話就是資訊管理上的GIGO,垃圾進垃圾出了…該研究並未檢測區隔效度,甚至也沒有按照學界慣例提供6個構念之間的15個相關係數,因此有些審查人可能會忽略這個問題的存在。

當然,學界對於接下來的處理方式尚無共識,有人主張應該將這三者合併然後再跑SEM,從而對原有的理論模式加以修訂,有人認為應該回到信效度階段,檢測共同方法變異(common method variance; CMV)是否嚴重到導致資料喪失分析價值,當然也有部分學者認為無所謂,只不過他們無法提出具有說服力的理由…英文期刊中偶爾會出現路徑係數高於0.9的論文,但頂尖期刊當中幾乎看不到!

放水護航所為何來?

顯然,從理論層面到實證過程,該研究都是因陋就簡錯誤不絕,不論從學術研究或診斷研究的角度來看,都絕對達不到合格的水準,但最後不但幫助林智堅獲得碩士學位,還笑納竹科管理局那45萬元的酬勞…雖然這筆錢按理是分給中華大學、計畫主持人、和研究助理。

我可以瞭解指導教授和其他兩位碩士論文審查委員的苦衷。我們畢竟都是人,擺脫不了人情世故,而幫助自己的學生畢業和賣指導教授一個面子,都是學界慣常的人情世故,差別只在於要犧牲學術倫理到什麼程度,而在國內碩士論文品質普遍不佳之下,這種犧牲似乎也沒有多麼嚴重,頂多就是50步與60步的差別罷了。

然而,對於那些應聘到竹科管理局審查研究計畫和最終報告的學者專家,我就搞不懂了。難不成他們都是計畫主持人的親朋故舊,或者竹科管理局已經對他們或明或暗的給予提示,導致他們像睜眼瞎子一樣,根本不在意報告中諸多即使我這個學界小咖也一清二楚的重大缺失,純粹只是走個流程,一開始就注定是放水護航的結果?

我不希望出現這種狀況…一堆德高望重的學者專家,領著由政府公帑支付的審查費與車馬費,但所做的卻是把公帑送給私人,然後用程序正常來脫罪。我真的不希望,區區45萬也不應該具有這麼大的魔力,但我找不到其他合情合理的解釋!

*作者為大學退休教師

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章