主頁 > 瘋言瘋語 > 統計是沒有立場的嗎? 回應 “回應"對外電入返聯公投結果的報導" 與讀”有偏見的媒體不好嗎?”有感" (revised)

統計是沒有立場的嗎? 回應 “回應"對外電入返聯公投結果的報導" 與讀”有偏見的媒體不好嗎?”有感" (revised)

2008 年 04 月 10 日 發表留言 Go to comments
MSN說我的回應太長了,只好另闢一文. 從這些討論中,我個人也受益匪淺,希望各位也如是認為.
 
 
 
我本來提出的引子是這樣的:

"至於統計方法呢? 個人認為方法本身沒有,但是研究者會把自己的立場放進去. 舉例來講, 法官判案,相信人性本善的法官,會把虛無假設(null hypothesis)放有罪還是無罪? 相信人性本惡的法官,會把虛無假設放有罪還是無罪?這樣不同的虛無假設,會有什麼差別??"
 
 
 
確定不先自己想想看嗎?
 
 
 

好吧! 以下是我的回應.
 
——–
 
第一, 虛無假設(null hypothesis)往往是研究者的"立場"陳

 

舉一個簡單但是生活化的例子, 法律的虛無假設如果是"無罪"的話, 拒絕虛無假設(reject null hypothesis)表示"被告有罪". 因為null hypothesis是無罪,因此除非證據顯示有罪,否則無法推翻"無罪"的假設[1]. 相反的, 如果虛無假設是"有罪",除非證據證明被告清白,才可以推翻虛無假設, 證明被告"清白" . 舉證責任因此不同. 預設立場造成的不同,這是其一!

 

(我承認我有統計上的潔癖)統計上的用詞很小心, "拒絕虛無假設"的說法沒有問題, 但是須無假設無法被拒絕時呢有些統計學者堅持正確的用法(我不是統計專家,但是我也堅持這種說法,原因如後)"無法拒絕虛無假設(fail to reject the null hypothesis; 有的是說 “do not reject”)"而不是 "接受虛無假設(accept the null)"  為什麼呢? 有什麼差別呢?

 

首先,null hypothesis=無罪來講. “無法拒絕虛無假設的結果應該解讀為 無法否認無罪”, 這表示有兩種可能:第一,被告真的無罪; 第二,證據不足無法證明有罪” (證據不足不予起訴之類).  相對的如果用接受虛無假設的說法則表示接受被告無罪的推論, 證據不足的可能性就完全被否定了! 只要"證據不足"的可能性不能百分之百被排除, 都不應該使用"接受虛無假設"的用詞!

 

 

第二, "預設立場”(虛無假設)造成統計結果不同. 我指的統計上結果是指所謂的type I, Type II error.

Type I error 拒絕虛無假設,但虛無假設為真” (probability of rejecting the null, given the null hypothesis is true; i.e. false positive). 以上面虛無假設=無罪的例子, type I error是被告無罪(虛無為真)但卻被判有罪(拒絕虛無假設),也就是所謂冤獄的情況.

 

Type II error (fail to reject the null when alternative hypothesis is true; i.e. false negative)相對的可推出是罪犯逍遙法外的結果.如果把被告的判刑極端化拿死刑來講比較容易顯示嚴重性. 一般來說,人性本善的信念下, 當然上是希望冤獄愈少愈好(small type I error), 一般設為5% ,有的甚至設為1%. 而逍遙法外(type II error)是所謂的 1- power通常設為20%, 也就是說,寧可有20%逍遙法外, 不願意太多冤獄.  (為什麼選power=0.8和樣本數大小有關.有興趣者自己查閱那方面的研究)

 

那麼相反的,在虛無假設=有罪之下,預設的type I error維持在5%, type II error也維持在20%. 此時所謂的type I error就變成是被告有罪(虛無為真)但卻被無罪釋放或不起訴(拒絕虛無假設),也就是說type I error反而是逍遙法外的人只有5%, 而此時的Type II error就是冤獄, 反而高達20%! 可以說是所謂的寧可錯殺一百(20%), 不可放過一人(5%)”!! 這是其二!

 

列表如下: 

 

Type I error (5%)

Type II error (20%)

預設立場(H0):被告無罪

(無罪推定原則)

冤獄  (5%)

逍遙法外

預設立場(H0):被告有罪

(有罪推定原則)

逍遙法外

冤獄 (20%!)

 

 

由此例子顯示當預設立場不同時造成的統計結果有多大之不同! 那麼如果把上述的例子中的 "法律,法官"的虛無假設改成是"媒體記者報導"的虛無假設,各位不妨想想記者的"預設立場"到底有多大的影響,或是有多大的差別了 

 

所以回到原來提問者的問題: 難道沒有任何研究或是報導是沒有立場的嗎? 我希望這些討論之中讓這個問題得到更多的思考

 

 

——-

所謂舉一要反三, 再來看一個生活例子:

也可以想像驗血檢查有無感染某傳染病(例如SARS)的情況, 如果檢查結果為陽性,衛生單位提供藥給被懷疑感染者. 檢查結果為陰性, 衛生單位就不提供藥給被懷疑感染者. 藥當然是要錢的, 病是會傳染的, 沒病吃藥的話雖不會致死, 但可能會有副作用. 那麼從防止傳染病擴散的角度來看,檢疫的虛無假設應該設為什麼呢? 那麼從什麼角度來看會用相反的虛無假設? 應該不難回答了吧!  (提示: 參考上面的false positive, false negative)

 

(感覺上像是在上大學統計啊! )

 

>>>

回到: 回應"對外電入返聯公投結果的報導" 與讀”有偏見的媒體不好嗎?”有感" 

 

延伸閱讀:除非你能證明自己無罪,否則就是有罪!講的是香港的廉政公署.精采摘錄: "…..老馬告訴我,全世界的法律中都是遵照無罪推定原則的,僅有香港(和其他極少數被視為落後的例外)有那麼一條行之有年,而且受到人民超過九成以上支持的「假設有罪,被告需證明其無罪」的法律。…." . GG我把它對應到台灣,其中之一則回應:"節錄中華民國25上3796號判例:審理事實之法院,對於被告之犯罪證據,應從各方面詳予調查,以期發現真實,苟非調查之途徑已窮,而被告之犯罪嫌疑仍屬不能證明,要難遽為無罪之判斷。白話文的意思就是,除非檢調單位怎樣也查不出你有犯罪的證據,不然我們不能說你是清白的。")
 

 

[1] 7/23: 今天看到蘋果日報一則新聞,講的正是要證明有犯罪之意圖. 再度印證, 不起訴與無罪之間是有差別的,就如同統計上無法拒絕需無假設與接受需無假設也是有差別的. 貼新聞如下:

種族滅絕罪 暴行難舉證

2008年07月23日蘋果日報

天理昭彰
「波士尼亞屠夫」卡拉迪奇被控犯下諸多罪行,包括在1995年波士尼亞東部的雪布尼札(Srebrenica)大屠殺事件中犯下種族滅絕(genocide)罪。法律專家稱,種族滅絕罪是所有違反國際人道法的暴行中最嚴重但也最難證明的一條。
前南斯拉夫國際刑事法庭在1995年控告卡拉迪奇,在波士尼亞塞爾維亞部隊於雪布尼札屠殺將近8千名穆斯林男子與男孩事件中,犯下種族滅絕罪。這起大屠殺是前南斯拉夫國際刑事法庭在1990年代巴爾幹戰爭中,唯一被判決為種族滅絕的案件,且在去年2月獲聯合國高等法庭國際法庭確認。

必須證明有「意圖」
種族滅絕的定義為「刻意摧毀一個民族、種族、人種或宗教團體之整體或部分」,是由猶太裔波蘭人提出,用以形容納粹德國在二次大戰期間屠殺猶太人的罪行,1948年在聯合國會議上被認定為違反國際法。
不過,法律專家強調,由於必須證明有其「意圖」,因此除非被告實際要求或允許進行種族滅絕,否則很難判斷這是故意消滅某個團體的整體或部分,這使種族滅絕罪名在法庭上很難成立。全球首起種族滅絕罪的判決,是盧安達國際刑事法庭在1998年做出。該法庭判定塔巴市前市長阿凱亞蘇(Jean-Paul Akayesu)的種族滅絕罪成立,處以終身監禁。
◎編譯蔡佳慧

==update on 2/5/2010==

這篇是舊文了!不過今天有人問,我就把它找出來. 順便google一下,沒想到還發現學術期刊有討論過: 統計學裡無罪推定的精神. 因此把連結加上.

分類:瘋言瘋語
  1. Ching-hsiao
    2008 年 04 月 10 日 於 17:11:13

    單純考慮研究方面的話,我會說數學相對於所有其它研究領域是比較沒有立場問題的,而這個立場問題是假設的問題,也就是說要採行什麼樣的假設去進行邏輯推論下去。例如經濟學上有「人是理性動物」的這個假設,這個假設也許可受公評,但是在這個假設之下去邏輯推論得到的結果是該被尊重的。
    由於數學是處理非人的問題,所以假設上會比較沒辦法公評,但即使如此仍會盡量要求做到符合直觀。數學上的一個例子是所謂的選擇公設(Axiom of Choice or AC),假設有一百個非空集合(可以想成一百個裝有東西的籃子),你可以從每個集合挑出一個點(從每個籃子裡挑出一樣東西)。數學上的重點在於這個「挑的方法」是可以被「說清楚的」,數學上的語言叫做存在一個選擇函數(就是所謂可以說清楚的挑的方法),使得input是集合而outcome是集合中的點(記得函數的定義?你給我一個東西「集合」,我丟出一個東西「點」)。這個概念在集合的數目是有限個時沒任何的問題,那麼,如果有無限多個集合呢?數學上多數人選擇「相信」在無限多個集合的情況之下也存在一個這樣的函數,而數學上也可以證明說這個公設成立與否跟所有別的公設都不相衝突,也就是說這個公設是不可能由邏輯推論被證明為真或假(under the assumption of other Axioms)。更具體地說,公設是一切推論的起源,不能由別的公設推論而得;每個公設都是獨立成立的,你只能選擇要或不要接受一個公設。所以你可以either選擇相信AC或不相信AC去做研究。但是因為在集合個數是有限個之下是成立的,所以一般都會採用相信AC成立去做研究。

  2. .
    2008 年 04 月 10 日 於 19:04:32

    "  例如經濟學上有「人是理性動物」的這個假設,這個假設也許可受公評,但是在這個假設之下去邏輯推論得到的結果是該被尊重的。 "
     
    嗯,這和我原來的文章出發點是一樣的,是故我只討論假設是否切實際, 也就是"假設…可受公評"的部分來"公評"一番,因為推論的部分沒有什麼好爭議的. 我想自然科學比較沒有立場問題, 社會科學往往很難避免立場之爭. 
     
    另.有人跟我說,這兩篇寫的太學術了.但我認為. 這兩篇的基本精神(邏輯的東西,甚至這篇的統計)都是大學課程的內容範圍, 沒有艱澀的觀念. 也許是我用詞不道地,造成閱讀上的困難吧.

  3. Ching-hsiao
    2008 年 04 月 11 日 於 03:30:05

    接下來講講物理上的情況…物理研究基本上跟經濟一樣是數學加上現實世界的結合體,然而物理研究的對象是大自然而非人,所以相對而言假設會比像「人是理性的動物」這個經濟學上的假設來得客觀些。例如物理中古典力學(就是牛頓那三個運動定律),基本上是一個least action principle的結果,這個least action principle的大意是物理現象的發生一定是最小化某些東西(例如能量)的結果。這個原則所導出來的運動定律一直到十九世紀末廿世紀初都沒發現有問題,直到那時的一些天文觀測的結果發現理論與觀測有明顯的誤差存在而使得物理學家得重新思考哪裡出了問題。當然least action principle這個是一個不太需要改變的東西(這個算是物理界的信仰),所以重點變是在於要最小化的那些東西(例如能量)的定義是否得重新修正。後來發現例如動能等等跟時間有關的能量似乎都不是如古典力學中所想的那樣,所以對時間這東西重新做了定義後發展出來了相對論,而相對論應用在天文上則比單純的牛頓力學的預測要準確許多,也因此宣告了相對論的「正確性」。

  4. Ching-hsiao
    2008 年 04 月 11 日 於 03:30:32

    物理的假設常常會因為時代的進步而做修正,這些修正的目的是為了讓物理理論更能貼近現實世界的運作。上述的牛頓力學到(狹義)相對論的例子,最根本的修正就是對時間的看法。例如牛頓力學中認定的時間是一種絕對的東西,你我的一秒一定是同樣長度的,換句話說,如果你我有一只一模一樣的錶,那麼我的一秒和你的一秒不會有差異。這個想法在古代絕對是沒人會提出質疑的,但是當你發現,例如測量離地球而去的星球和迎面而來的星球,它們發出來的光速怎麼量都像是一樣時(對比:你在一列火車上對著我投球,火車是離我而去或是向我駛來絕對會影響我所測量的球速),你應該就會懷疑有什麼地方出了問題。而後來索性假設了光速怎麼量都是一樣的這個前提去發展理論(因為實驗上得到如此的結論),進而改變了人對時間的看法。這個前提的修正(時間是絕對的變成光速是絕對的),在日常生活中並起不了什麼大影響(這也是為什麼古代人沒發現絕對時間的假設沒問題),但是在天文的世界就變得影響重大(所以得要修正假設)。對物理而言,所持的立場就是:數學邏輯加上符合實驗觀察結果。

  5. 費雪
    2008 年 04 月 14 日 於 13:27:13

    是否拒絕虛無假設,其中一個關鍵在於樣本數和變異程度
    當樣本數大時,發生type 1 error and type 2 error的機率會同時變小
    換成法官的例子,如果兩造舉出的證據夠多(在無造假的前題)而法官又沒有選擇性的刻意忽略某些證據且法律素養夠
    錯判的機率會下降
    當然這個前題是法官本身可以依證據本身作公正的判斷
    台灣的問題是法官在這個前題上都已經被質疑了
    更不用談到媒體,連這個前題都是不存在的,所以再多樣本也無助於公正報導
     

  6. sg
    2008 年 04 月 14 日 於 17:17:57

    樣本數大小會影響power,連帶的影響type 2 erro,這已經提過. 另外基本上type 1, type 2 error之間有取設(trade off)
     
    有個不清楚的地方是,你說的證據夠多會減少誤判的情況. 也就是說,你的"樣本數"是指"證據"多少是嗎? 
    但是誤判否則是根據每個訴訟個案(a lawsuit case)為樣本數來計算,(例如:100個訴訟案,有5%被誤判等等)這和你講的證據多少為樣本數有差異, 還是我誤解你的意思,你並不是說證據為樣本數?

  7. 費雪
    2008 年 04 月 14 日 於 18:50:03

    在法官判案的例子中
    審判案件相當於假設檢定的過程
    證據相當於樣本數
    證據愈充份相當於統計中的樣本數愈多
    換句話說
    如果讓法官有更多的資訊(用來推測母體的樣本)來了解案件的背景以及原告被告的行為和動機
    則法官誤判的機率會降低
    However, 舉證之所在,敗訴之所在
     

  8. 費雪
    2008 年 04 月 14 日 於 19:04:35

    此外
    原則上type1 error 和type2 error 是trade-off沒錯
    type 1 error愈大則type2愈小,反之亦然
    但是,樣本數增大則會使兩者同步減少
    這是trade-off唯一的例外

  9. sg
    2008 年 04 月 14 日 於 19:25:15

    我了解證據愈多誤判的可能愈小, 我也知道當樣本愈大(事實上這不是唯一例外,還有所謂homegeneity, independence等 但假設這些都成立步討論)一般來說愈好.如果實際計算,很快就會發現樣本數會非常非常大,這是為什麼一般將type 2 error定於20% (power=0.8,而不是更高的關係) 但所謂的Trade off是指,暨有的樣本數下,到底希望是type 1 error多還是type 2 error高( 冤獄多還是逍遙法外的多)? 
     
    因此, 以證據當樣本數有幾個問題:
    1) 司法系統下的期望冤獄要設多少?  這個和法律有無效率有關係. 而法官的實際誤判率又要如何計算?  
    反之以一個訴訟案件為樣本數就可以清楚計算期望與法官實際判案後的誤判率等等.
    2) 如果證據數=樣本數, 既有的證據下(既有樣本數),法官的type1 & type 2 error取捨不就顯得更為舉足輕重,反而得不到利用充分資料減少誤判的目的了嗎?
    正是因為每個案件都是想要推導到底要不要拒絕虛無假設,所以不是更應該以一個訴訟案件為樣本數嗎? 
    用證據數=樣本數還真把我搞糊塗了啊

  10. 費雪
    2008 年 04 月 15 日 於 12:34:13

    Summarize相關討論如下:
    證據愈充份就像樣本數愈多如果被告沒做,但是對被告有利的樣本不夠,可能就會有type 1因為此時抽樣分配和母體分配不同證據數可以分為對被告有利的數目和對被告不利的數目如果事實是被告沒罪,證據愈多照理會傾向被告沒罪的比例較高顯示被告沒罪的證據數量會比較高所以法官誤判被告有罪的機率會降低當然這也關係到雙方舉證的能力然而,證據本身有強有弱  一個有利的證據應該可以抵上多個若證據  但是如果證據數來算等於是假定所有證據強弱一樣 或是強弱不同也不重要了 所以,可以用換算成點數,positive points and negative pointsHowever, 在這種想法之下  為了控制務判律  有可能會得無止盡的去搜集證據而在證據有線的情況下 法官的先入為主反而更嚴重最後,
    事實只有1和0,沒有機率問題就單一案件來說,type 1,2不是1就是0

  11. .
    2008 年 04 月 16 日 於 02:45:32

    summary漏掉最後的一段,"就單一案件來說。。。"那麼樣本數就回到案件,而不是證據了。
     
    單一案件來講不是黑即白,這是事後也就是實際的type1, 2 error. 我之前留言提過,證據數=樣本數會面對無法計算預期(a prior)or 與事後(actual)type1,2 err的問題. 預期的type1,2 error之所以重要在於它牽涉道統計方法是否有效率(決定抽樣多少,樣本是否具代表性等等),類似的法律規範也有效率問題(到底要少冤獄,還是要比較少的人逍遙法外).

     
    統計的真意就在於沒有可能窮盡所有的母體,因此只好抽樣,在這種情況下才有所謂的type 1, type 2 error,精確點講,預設的type1 error要多大(因為這相當於願意忍受的誤判成本),在有限的資源下盡可能的樣本愈大愈好. 講單一案件的時候type 1, 2 error沒有意義.因為單一案件的話樣本數只是1,這種統計數字沒有意義, 討論單一案件的type 1,2 error更沒有意義.

  1. No trackbacks yet.

發表留言