從疫苗有效性,談事件因果關(guān)係
文:黃正傑 2021-07-20
發(fā)布時間: 2021-07-20 09:41:00
科技意會 數(shù)位轉(zhuǎn)型 大數(shù)據(jù)
國產(chǎn)疫苗有效嗎? 為什麼要緊急授權(quán)? 這是在疫情下民眾會討論的話題,但其實是一個科學(xué)問題、一個數(shù)據(jù)方法問題。本文主要從疫苗有效性,談?wù)搶嶒炘O(shè)計方法以及大數(shù)據(jù)、機器學(xué)習(xí)方法可以協(xié)助的地方。數(shù)據(jù)驅(qū)動的企業(yè)應(yīng)該要善用傳統(tǒng)與新的數(shù)據(jù)方法。
疫苗有效嗎?
大多人在討論國產(chǎn)疫苗有沒有效? 第三期實驗做不做? 政府要用EUA授權(quán)來彌補傳統(tǒng)的疫苗製造過程,或者判定打疫苗後猝死跟疫苗有沒有關(guān)係等。從這些疫苗的爭議中,我們可以發(fā)現(xiàn),要證明疫苗有沒有效,需要數(shù)千、乃至於數(shù)萬個疫苗測試者和未施打人比較,是否能夠有效抵抗病毒等,這需要嚴(yán)謹(jǐn)?shù)膶嶒炘O(shè)計、科學(xué)方法來驗證疫苗,與是否能抵抗病毒的因果關(guān)係。
實驗設(shè)計證明因果關(guān)係
我們都知道要證明事件間的因果關(guān)係實在並不容易,因為太多因素在干擾了:人們的年齡、身體健康因素、居住的環(huán)境、飲食的問題等,都影響疫苗的有效性。因此,我們需要控制干擾因素的做法以證明事件間的因果關(guān)係。
實驗設(shè)計就是一種證明事情因果關(guān)係的統(tǒng)計、數(shù)據(jù)科學(xué)方法 (註:當(dāng)然,還有許多比實驗設(shè)計更嚴(yán)謹(jǐn)?shù)囊蚬治龇椒?。
費雪被稱為「現(xiàn)代統(tǒng)計學(xué)之父」,在1926年發(fā)表了隨機實驗設(shè)計法,透過隨機、重複、集區(qū)等原則進行實驗設(shè)計,以分析事件間是否有因果關(guān)係或是受到其他影響因素影響。例如:實驗不同品種小麥?zhǔn)欠駮杏绊懯辗偭俊?/span>
首先要控制的是土地的肥沃度、土質(zhì)、含水量等影響因素。因為在條件不一的土地上,種植不同品種小麥,收穫量不同可能來自於品種不同,也可能是土地本身造成的影響。因此,實驗設(shè)計方法就是把地質(zhì)條件相對齊的土地區(qū)塊組合成「集區(qū)」,在每一集區(qū)內(nèi)地質(zhì)條件相近的土地上種植不同品種的小麥;收穫量的不同,就可完全歸因於品種的差別。
「隨機」的作法就是把不同品種小麥隨機種在不同區(qū)塊的土地、「重複」則是將實驗設(shè)計重複幾次。最後,利用統(tǒng)計學(xué)方法分析不同品種小麥?zhǔn)欠耧@著影響收穫量。
圖、費雪拉丁方實驗設(shè)計法(資料來源:Baily etc al. (2008))
大數(shù)據(jù)可以協(xié)助實驗設(shè)計
實驗設(shè)計的發(fā)明將近兩百年,已經(jīng)廣泛的運用在各行各業(yè),如:農(nóng)業(yè)、工業(yè)、醫(yī)療衛(wèi)生領(lǐng)域。在工廠品質(zhì)領(lǐng)域,有1950年代由田口玄一創(chuàng)始的田口實驗方法,用來檢驗品質(zhì)要因 (影響因素) 對於品質(zhì)特性的影響。
不過,從疫苗的爭議中,我們可以了解到,實驗設(shè)計必須經(jīng)過數(shù)年、多人測試的驗證,而且還必須在自然隨機的環(huán)境下 (如:COVID-19普遍流行的地區(qū)測試)。以此,實驗設(shè)計必須長期、嚴(yán)謹(jǐn)?shù)剡M行科學(xué)的驗證。
運用在工廠的品質(zhì)領(lǐng)域中,同樣面臨尋找品質(zhì)要因的困難、缺乏具有技巧品質(zhì)工程人員等因素,使得中小型的工廠不易使用。此外,若影響品質(zhì)的因素眾多,需要大量實驗數(shù)據(jù)與重複實驗次數(shù),更增添困難度。
在大數(shù)據(jù)、物聯(lián)網(wǎng)技術(shù)發(fā)展的今天,我們可以利用決策樹、多元回歸等機器學(xué)習(xí)方法,讓電腦快速地發(fā)現(xiàn)影響品質(zhì)的要因,甚至透過物聯(lián)網(wǎng)的即時數(shù)據(jù),預(yù)測每一批生產(chǎn)的品質(zhì)良率。例如:WD硬碟製造商,就追蹤硬碟機生產(chǎn)過程,以預(yù)測每個硬碟生產(chǎn)品質(zhì),以避免出貨後因品質(zhì)問題造成顧客資料遺失的形象與法律糾紛。
事實上,在2020年COVID-19大爆發(fā)初期,也是利用機器學(xué)習(xí)方法快速分析可以抑制病毒的舊藥,或者利用藥物數(shù)據(jù)庫快速產(chǎn)生新的化學(xué)結(jié)構(gòu)模型,以協(xié)助緊急藥物發(fā)展需求。大數(shù)據(jù)、機器學(xué)習(xí)方法擅長從大量數(shù)據(jù)中找出數(shù)據(jù)影響關(guān)鍵因子、多因素對於結(jié)果的影響等,快速地發(fā)現(xiàn)並能預(yù)測結(jié)果。
小結(jié)
儘管機器學(xué)習(xí)方法並不若傳統(tǒng)實驗設(shè)計方法在因果關(guān)係上的驗證嚴(yán)謹(jǐn),但卻能夠滿足在資源不足的狀況下,快速取得結(jié)果。如同疫苗的緊急授權(quán)、快篩或新藥發(fā)現(xiàn)的做法,以快制亂,進一步再用嚴(yán)謹(jǐn)方法進行確認(rèn)。
以此,可以發(fā)現(xiàn)在大數(shù)據(jù)、物聯(lián)網(wǎng)的技術(shù)發(fā)展下,不論在行銷、工廠、醫(yī)學(xué)等各個領(lǐng)域都有與傳統(tǒng)數(shù)據(jù)方法相互結(jié)合產(chǎn)生新的火花,讓我們一起探究數(shù)據(jù)驅(qū)動的各項創(chuàng)新應(yīng)用!!
黃正傑
你喜歡挑戰(zhàn)不斷隆起的技術(shù)高原、探索無限寬廣的創(chuàng)新領(lǐng)域嗎? 那麼我們是同路人。黃正傑,臺大資管博士,協(xié)助鼎新進行前瞻技術(shù)研究與應(yīng)用發(fā)展。歷經(jīng)IT架構(gòu)技術(shù)顧問、供應(yīng)鏈管理顧問、軟體產(chǎn)業(yè)分析師等多項職務(wù),並兼任文化大學(xué)助理教授。讓我們一起從創(chuàng)新與變革角度,探索新興技術(shù)!
更多案例