Monday, May 31, 2021

Dirty Estimation on the Quick Test Spec of COVID-19

簡單結論:
  1. 從上個星期疫情指揮中心發布的有限資料來看,快篩試劑的敏感性可能達到 95%,特異性甚至高到接近 99%。意思是說 20 個感染者可能有 1 個抓不到,而平均 100 個沒有被感染者有 1 個多一點點被誤判成陽性。不過這些都還是在有限的樣本與假設台北、新北、台中三都所使用的快篩試劑品質相同之下算出來的,可能會有可觀的誤差。

  2. 從 5/21 到 5/26 這段日子的樣本估算,台北的盛行率約 3.6%,新北約 2.6%,而台中不及 0.1%。這些是熱區結果,實際上三都的盛行率要遠低於這些數據。

  3. 即便是目前的疫情,用快篩普篩大約會在全國篩出廿幾萬的假陽性,而相對應的真陽性可能只有萬餘。就算中央與地方政府合作可以在短時間解決快篩以及接下來的 PCR 檢驗,仍然沒有足夠的容量可以處理隔離的需要。只有到盛行率高到不再用現行的隔離方式,普篩才有實務上的價值。
問題:快篩試劑的敏感性跟特異性到底是多少?

最近台灣開始使用快篩來幫助抓出熱區的感染者,不過我一直對快篩的準確度很好奇,這些資訊是判斷偽陽性與偽陰性重要的基礎。之前看到兩篇分析盛行率 (prevalence rate,樣本總人數中感染某疾病的百分比) 對於偽陽性與偽陰性的影響時,對於快篩試劑的準確度所使用的參數差很多,不過我們沒有資訊可以拿來評估,所以也只能將就看著。

上個星期中央疫情指揮中心拿出下面這個表格來,雖然檢驗還沒有完成,總算是有了一些可以用的實證資訊了。


先說明一下在相關討論裡常用到的名詞。前面提到了盛行率,另外兩個重要的名詞是敏感性 (sensitivity) 與特異性 (specificity):
  • 敏感性 = 真陽性/(真陽性 + 偽陰性)
  • 特異性 = 真陰性/(真陰性 + 偽陽性)
這裡的陽性陰性都是指快篩的結果,真陽性的定義是快篩陽性而且在更精確的 PCR 也顯示陽性,偽陽性則是快篩陽性但是 PCR 檢驗結果是陰性。真陰性是快篩陰性而且 PCR 也顯示陰性,偽陰性則是快篩陰性可是 PCR 為陽性。這些是基本名詞的定義。

把這些名詞的關係整理在下面的表格裡:

真正感染的人數是把所有的樣本數乘上盛行率,不過快篩並不能篩出所有的患者來,這個數字乘上敏感性之後才是快篩陽性而且真正感染的人數。大家會擔心有漏網之魚在社區裡繼續感染,這個偽陰性數字就是右下的樣本數乘以盛行率再乘以 (1-敏感性)。

以上面表格中的台北市來說,那 58 件 PCR 陽性件數是真陽性,已有結果的 77 件快篩陽性是真陽性加上偽陽性,所以偽陽性是 (77-58) = 19 件。快篩陰性之後的資料在這裡並沒有顯示,所以真陰性與偽陰性的資料無法從上面的表格得知。

如果以個別縣市來看,我們只有還沒有驗完的真陽性與偽陽性,就算我們按比例放大為全部驗完後真陽性與偽陽性的數據,仍然沒有辦法同時求出該縣市的盛行率與快篩試劑的敏感性與特異性三個未知數。不過這是一個開始,我們至少可以抓個合理的範圍。舉例來說,如果台北市的樣本中盛行率高達 5% 的話,那麼在全部 90 件快篩陽性裡面有 68 個真陽性 (68/90 跟目前比例約略相當) 就要敏感性低到 69% 才能支持這樣的結果。目前武漢肺炎快篩試劑的敏感性不會這麼低,這效果太糟了。這表示盛行率應該要比 5% 更低些,畢竟如果不考慮偽陰性,真陽性除以總樣本用這裡假設真陽性 68 件來算,不過是 3.45% 而已。像樣的試劑不該會有太高的偽陰性才對。

這裡我們有三個樣本數較高的縣市:台北市、新北市跟台中市,其他縣市檢驗樣本數太少,差一個確診就會讓比例差很遠,所以就不用了。

接下來我用的假設如下:
  1. 各縣市使用的快篩試劑相同,或最起碼敏感性與特異性相同。
  2. 還沒有驗完的樣本最後全部真陽性與偽陽性的比例跟已經驗出來的部分相同。
如果快篩試劑的敏感性跟特異性相同的話,我們其實就有三都的真陽性與偽陽性共六個樣本點來求三都的盛行率及敏感性與特異性五個參數,如此一來雖然自由度少的可憐,不過勉強可以求解了。我這裡只是簡單的拿實現值與估計值的差異平方和最小值來估計參數,除了這不是線性迴歸式外,基本觀念就是一般用在線性迴歸式的最小平方法。自由度為1的估計我們就不用談標準差了,一定不會小的。我們把這件事情放在心上來看參數估計就好,千萬要記得這裡的標準差一定很大。

所有樣本權重相同的情況下結果是:
敏感性:95.02%
特異性:98.78%
台北市樣本盛行率:3.62%
新北市樣本盛行率:2.58%
台中市樣本盛行率:0.08%

三都的實際盛行率會遠低於樣本盛行率,因為快篩站是設在感染熱區,而受驗者也是有直接或間接接觸者,很多還有類似的症狀,屬於高風險族群。

有了這些資料就可以來推估疫情指揮中心資料裡沒有的真/偽陰性的數據了。下面是三都的資料,我在計算最後人數的時候並沒有四捨五入,這樣對於台中市這種偽陰性很小的數據,可以看得出來到底是多小而不是直接給個 0 來帶過。



如果只做快篩沒有做 PCR,以實際感染者卻被快篩漏掉的來看,台中只有 0.2 人,所以完全不用擔心這個問題。台北跟新北其實也不多,大概各三個人左右。這三個人回去社區以後會不會造成感染?當然是有可能的。所以還是需要自主管理十四天,如果情況惡化的話要盡快就醫。

問題比較大的在偽陽性這一邊。以目前的流程來說,處置的方式是所有快篩陽性都要先隔離,以這裡有限的樣本數來說就已經為數不少。隨著樣本數增加,這個數字還會大幅度增加,也就是說如果普篩的話,偽陽性跟真陽性的差距會遠比台中市來的更大。因為隨著盛行率下降,這個數字會來的更高。我這裡算出來的特異性也高過我之前聽過的最大版本,這個數據如果下修,也會讓偽陽性變的更大 (偽陽性 = 總人數*(1-盛行率)*(1-特異性))。


如果兩千三百萬人普篩,就算盛行率是千分之一,也有 28 萬人快篩是偽陽性。台灣能夠 1 人 1 室隔離的有多少人?要能夠生出 28 萬個隔離單位來才行。這個盛行率以目前全國確診情況來看應該還是高估了。在今年四月以前,應該連萬分之一也不到。

假如盛行率高達 10%跟美國約略相當,普篩之下偽陽性也還是有 25 萬人。所以對於普篩來講,其實盛行率對於偽陽性人數不是太大的問題。只是那時候大家傷腦筋的是 218.5 萬的真陽性,處理方式也不一樣了,不會再有什麼集中檢疫所或1人1室隔離的事情了。







Sunday, February 28, 2021

The Power Failure in Texas is Just Like an Old Stock Market Story

簡單結論:

  1. 夏蟲不可以語冰,沒遇過這種冬天,就很難指望德州電廠跟電網能夠事前做好準備。
  2. 要防止所有風險當然技術上可以做到,不過成本效益不見得合理。
  3. 人家備轉容量高達 31% 以上都還捅這種樓子,台電當日備轉容量達到 10% 就算是亮綠燈還很少出問題真是祖上積德。

德州電力供給失調的背景介紹:

今年冬天德州出現了罕見的低溫,即便事前大家從氣象預告都已經知道了這件事情會發生,但是沒有多少人預期到接下來的後果是大範圍連續多日的停電。

事情剛開始的時候,大家努力的在找替罪羔羊。WSJ 一開始把責任歸咎於綠能,因為風力發電機由於寒冬而凍住無法發電。

WSJ, Feb. 15, 2021, "A Deep Green Freeze", by The Editorial Board

WSJ, Feb. 16, 2021, "The Political Making of a Texas Power Outage", by The Editorial Board

這個當下最保險的電力來源是燃煤的火力發電,不過由於污染及碳排放的因素,在德州的市佔從十年前的超過百分之五十已經下降到 18% 了。在災情剛開始的時候,天然氣跟燃煤電廠都大幅度增加發電量,試圖補足風力發電下降與因為低溫上升的需求所造成的缺口。

風電業者當然也不用等多久就可以強力反擊。不過只在一兩天之內,德州難得一見的嚴寒讓天然氣輸送也停擺了。接下來就是一連串的分區供電甚或直接停電。再來就是一連串的口水戰。我這裡只引 WSJ 的社論,不過大家也不用照單全收,我們從他們的論述跟反擊大概可以推敲出風電業者的說詞以及整個事件的時間軸。

WSJ, Feb.17, 2021, "Texas Spins Into the Wind", by The Editorial Board

在災情初期,風電發電佔比從之前一個星期佔總發電量 42% 下降到 8%,這當然是要靠著火力發電一開始大幅增加發電量把分母給維持住跟先前差不多的水準。等到大停電之後這個百分比就沒有意義了,反正電不夠用,辯駁自己發的多一點點沒有意義。值得注意的幾個數據是:

德州冬季最高發電容量可達 83,000 MW,而實際的顛峰用電發電量大約是 57,000 MW。這裡面風電的容量大約是 30,000 MW,由於穩定性較差,所以上個月發電量介於 600 到 22,500 MW 之間,平常管制單位是期望電力發電提供大約 10% 以上的用電量。在風力發電失效後,天然氣發電在 2/14 晚上全力運轉時提供了大約 43,800 MW 的電量,而燃煤的火力發電廠補上來 10,800 MW。這些數字雖然仍不及顛峰需求,不過如果靠著大家節省一點,多少也可以過下去。

然後天然氣運輸管線的加壓器也凍住了,接下來是天然氣電廠也逐漸停擺,終至一發不可收拾。

這裡面風電的容量數據可能不是冬天的,要不然幾個數字加起來其實超過前面提到的 83,000 MW 總發電容量。而且德州目前還有兩座運轉中的核能電廠,他們的發電量加起來大約是 5,000 MW。核能電廠在這次災情中沒有被廣泛報導,不過 WSJ 這篇 2/17 的文章雖然幫天然氣、燃煤與核能電廠講話,文中也提到核能電廠供電也出了問題,不是完全的不受天候影響。

還有一些相關的討論談到德州電網跟美國其他區域分離,導致德州發電廠失效的時候就無電可輸了,沒辦法靠其他地方的電廠支援。我這裡就不找相關連結了,不過德州電網自成一區是真的,這張圖的來源是美國的 EPA



太陽底下沒有新鮮事:

這種極端氣候在德州罕見,所以過往也沒看過這種來個極地寒流搞到整個州電力供給停擺的事情,不過類似的事情我們在股票市場見多了。

這就是所謂的系統性風險,幾乎沒有任何人可以躲掉,只是輕重不一而已。一開始看到風電停擺還以為是個別性風險,沒兩天就發現每一種電廠都逃不了,才知道這其實是系統性的,大家都有份。在股市裡要躲掉系統性風險除了降低持股部位或是反手建立空方部位避險之外別無他法,而且那是法人或是專業投資人才適合的手段,一般散戶可能最好的作法是戴著鋼盔睡覺,裝做沒看見。但是在電力供需上,電廠跟用戶都沒辦法減持部位或放空的,充其量只有用戶自備發電機或是像 Ted Cruz 一樣飛到 Cancun 去(然後被罵了以後飛回來 XD)。

假如德州的電網不自成一格,能不能解決這次的困境。情況會好一點,不過好的大概很有限。這個極端氣候影響美國很多區域,德州又是大州,搞不好他們會拖累其他區域一起分區限電停電也不一定。德州一州的故事其實看起來只是任何一個股票大回檔的故事,跟其他地方連在一起,搞不好就是 2008 金融風暴的電力版了。

追根究柢其實就是德州作為一個美國南方的州,對於這種極端嚴寒的氣候缺乏準備,簡單的說就是「夏蟲不可以語冰」。

問題要如何解決?

不是只有德州才在冬天用風電跟天然氣,用這些發電方式而且比德州冷的多的地方所在多有,也沒見他們出事。如果冬天本來就會這麼冷,在安裝風電跟天然氣管的時候,必然就會考慮到嚴寒氣候的影響,以免來個暴風雪就停擺。德州當然也可以,問題是成本。下面這篇文章提到了這點。

WSJ, Feb. 26, 2021, "Grid Reliability Is Feasible, but at What Cost?", by Jinjoo Lee

在事件發生之初,大家吵的是有沒有哪一種能源可以免於類似這次的災難。風電最先被指責,不過後來發現其他的發電方式也會出問題。財務的知識告訴我們分散風險仍然是好的,就以這次來說,如果德州全靠綠電,那麼整個系統在寒流來的第一天就全掛了。那些逐漸被淘汰的燃煤發電反而幫忙補上了一陣子。

剩下來的就是保險。投資風險性資產能不能透過工具避險到完全沒有風險?當然有可能,不過預期獲利在考慮避險工具的設計交易也要成本之下,大概還不如一開始就直接買政府公債好。這裡也是一樣,德州當然也可以使用能夠預防嚴寒的設備,以預備幾年甚至十幾年一次的這種大寒流。雖然德州地震不多,當然也可以把防震考慮上。然後颱風自然是要準備的,這裡真的有。等我們把所有可能的風險都考慮完了,電費帳單大概也破表了。這中間一定要找尋一定的均衡點,某些天災影響發電可能只是一兩天,而且造成的只是不便而非生命損失,那就省點錢也無妨。

當然這並不是說目前德州的作法完全沒有錯。事後的檢討多少可以找到一些即便在現有制度上透過管理流程的改變也可以多少改善情況的建議,不過我的猜測是大規模停電還是要停,也還是會停好一陣子。

台灣可以記取的教訓:

德州冬天的備轉容量(總發電容量跟用電量的差距)與總發電量的比值大約是 31% 以上,台電的尖峰備轉容量差過 10% 就算供電充裕亮綠燈了。隨著台灣使用綠能的比例逐漸升高,我們也應該要注意這些靠天吃飯的能源雖然可能比較乾淨,但是也比較不穩定。有些不穩定問題較小,譬如說太陽能發電,其實跟台灣用電習慣有些天然避險的效果。當太陽大天氣熱大家要用冷氣的白天,多半也是太陽能發電供電最多的時候。台灣的風力發電將來主力在台灣海峽,理論上是不錯的穩定風場,受到颱風跟地震影響也比太平洋這邊要輕,但是這並不表示完全沒事。當這些綠電比例上升時,不要太快放棄污染較高的傳統發電方式,而要將台灣的備轉容量再墊高一些。綠電將來有可能成為主力的發電方式,為了他們提供足夠的避險是必要的。火力發電是比較良好的替代品,不要太快放棄了。