近日,鐘南山院士團(tuán)隊(duì)在Journal of Thoracic Disease發(fā)表“基于SEIR優(yōu)化模型和AI對公共衛(wèi)生干預(yù)下的中國COVID-19暴發(fā)趨勢預(yù)測”的文章。
該研究預(yù)測了COVID-19疫情全國在2月下旬達(dá)到高峰,4月底趨于平緩。如管控措施推遲5天實(shí)施,中國大陸的疫情規(guī)模預(yù)估將擴(kuò)大至3倍;如減低武漢管控力度,湖北可能在3月中旬出現(xiàn)第二次疫情高峰并延續(xù)至4月下旬。其中,優(yōu)化的SEIR模型和AI模型預(yù)測表明,截至4月底國內(nèi)有9萬至12萬的疫情規(guī)模,請大眾不要誤解,模型預(yù)測與現(xiàn)實(shí)是存在一定差距的,如政府繼續(xù)嚴(yán)格的管控政策,提高診斷水平,推出使用藥物,該疫情規(guī)模將得到極大控制。另外,本文提及的湖北出現(xiàn)二次高峰是在管控降低的情況下作出的假設(shè),如正常春運(yùn),復(fù)工等。按目前情況,湖北省政府仍將繼續(xù)保持嚴(yán)格管控,出現(xiàn)二次高峰的可能性也相對較少。
目前本文預(yù)測結(jié)果是基于2月9日前的管控政策,疫情規(guī)模均比Lancet及國外學(xué)者預(yù)測的少。Wu等學(xué)者預(yù)測武漢的疫情規(guī)模將在1月25日達(dá)到17.5萬例,疫情將在4月達(dá)到高峰。同樣,Read等人預(yù)測,在沒有控制措施的情況下,將在2月4日達(dá)到高峰,高達(dá)19萬例。即使是交通管控也不能獲得很好的效果。上述預(yù)測均沒有考慮到我國嚴(yán)格管控的措施,導(dǎo)致可能夸大的疫情規(guī)模。本文數(shù)據(jù)顯示截至4月底國內(nèi)疫情現(xiàn)存確診病例(非累計確診數(shù))高峰不高于7萬例,湖北不高于52000例,廣東和浙江不高于1200例,目前流行數(shù)據(jù)均在本文的預(yù)測范圍內(nèi),更貼近真實(shí)情況。
文章結(jié)果結(jié)論是基于SEIR數(shù)學(xué)模型和AI模型進(jìn)行預(yù)測的,歡迎大家閱讀。
楊子峰1,5,曾志奇1,王珂2,黃淑珊1,7,梁文華1,Mark Zanin1,7,劉鵬3,曹旭東3,高中強(qiáng)3,麥芷桐1,梁靖怡1,劉曉青1,李時悅1,黎毅敏1,葉楓1,關(guān)偉杰1,楊一帆4,李飛4,羅圣美4,謝玉琪1,劉斌6,王周瑯1,張少博2,王耀南2,鐘南山1,何建行1
1廣州醫(yī)科大學(xué)附屬第一醫(yī)院廣州呼吸健康研究院呼吸疾病國家重點(diǎn)實(shí)驗(yàn)室/國家呼吸系統(tǒng)疾病臨床醫(yī)學(xué)研究中心
2橫琴鯨準(zhǔn)智慧醫(yī)療科技有限公司
3南京云創(chuàng)大數(shù)據(jù)科技股份有限公司
4星環(huán)信息科技 (上海) 有限公司
5澳門科技大學(xué),中藥質(zhì)量研究國家重點(diǎn)實(shí)驗(yàn)室,澳門藥物及健康應(yīng)用研究院,中醫(yī)藥學(xué)院,澳門特別行政區(qū),中國
6昆明理工大學(xué)
7香港大學(xué)公共衛(wèi)生學(xué)院,香港特別行政區(qū),中國
通訊作者 何建行
電子郵箱: hejx@vip.163.com
鐘南山
電子郵箱: nanshan@vip.163.com
注:楊子峰、曾志奇、王珂、黃淑珊、梁文華、Mark Zanin、劉鵬對此文章貢獻(xiàn)相同。
摘要
背景:中國湖北省武漢市新型冠狀病毒肺炎(COVID-19)的暴發(fā)恰逢人口大規(guī)模遷徙的春運(yùn)時期。為遏制疫情蔓延,中國政府于2020年1月23日起采取了大規(guī)模檢疫、限制出行和對可疑病例監(jiān)控等前所未有的全國性防疫干預(yù)措施。但尚不清楚這些政策是否有益于流行病的控制。
方法:本研究將2020年1月23日前后的人口遷徙數(shù)據(jù)以及最新的COVID-19流行病學(xué)數(shù)據(jù)整合到經(jīng)典傳染病學(xué)預(yù)測模型(SEIR)中并得出流行曲線。此外,基于2003年SARS數(shù)據(jù)進(jìn)行訓(xùn)練的人工智能(AI)方法來預(yù)測本次疫情的流行趨勢。
結(jié)果:推測本次疫情全國在2月下旬達(dá)到高峰,4月底趨于平緩。如管控措施推遲5天實(shí)施,中國大陸的疫情規(guī)模預(yù)估將擴(kuò)大至3倍;如減低武漢管控力度,湖北可能在3月中旬出現(xiàn)第二次疫情高峰并延續(xù)至4月下旬。
結(jié)論:優(yōu)化的SEIR模型及成功建立的人工智能模型能有效預(yù)測新冠病毒的流行趨勢,證實(shí) 1月23日起實(shí)施的公共衛(wèi)生干預(yù)措施有效控制了疫情發(fā)展。
引言
2019年12月,中國湖北省武漢市暴發(fā)了由新型人畜共患病冠狀病毒(SARS-CoV-2)引發(fā)的非典型肺炎(COVID-19)[1-2]。之后,疫情迅速蔓延。截至目前,國內(nèi)已報告7萬余例感染病例和2000多例死亡病例,全球報告感染超過3000例 [3-4],疫情嚴(yán)重程度已超過2003年的嚴(yán)重急性呼吸綜合征(SARS)[5]。本次疫情恰逢在春運(yùn)期間暴發(fā),為遏制疫情,中國于2020年1月23日開始實(shí)施前所未有的公共衛(wèi)生干預(yù)策略[6]:封閉武漢的離城通道,延長了法定假日,采取了嚴(yán)格旅行和公共聚會限制措施,關(guān)閉了公共場所,并在全國范圍內(nèi)實(shí)施了健康監(jiān)測。但是,尚不清楚這些政策對疫情的控制效果,以及應(yīng)當(dāng)保持實(shí)施多長時間。因此,本研究通過優(yōu)化的易感-暴露-感染-退出(SEIR)流行病學(xué)模型,結(jié)合了1月23日前后的國內(nèi)遷徙數(shù)據(jù)以及最新的COVID-19流行病學(xué)數(shù)據(jù)來預(yù)測疾病發(fā)展進(jìn)程。另外,還使用了2003年SARS冠狀病毒暴發(fā)數(shù)據(jù)進(jìn)行了機(jī)器學(xué)習(xí),通過人工智能(AI)方法證實(shí)了我們的模型預(yù)測。
結(jié)果
一、湖北省、廣東省和浙江省的疫情進(jìn)展
本文選擇了COVID-19確診病例數(shù)最多的三個省份進(jìn)行研究[7-8]。2月10日,湖北省、廣東省和浙江省COVID-19的確診病例分別為31728例、1177例和1117例 (圖1A)。1月7日至23日,廣東省和浙江省的遷出人數(shù)達(dá)到最大且高于流入量。而對于湖北省來說,在1月23日之前,由于春節(jié)期間遷移人口的返回,其遷入人數(shù)大于流出量。1月23日之后,湖北省開始實(shí)施公共衛(wèi)生干預(yù)措施如限制出行,遷移曲線與廣東省和浙江省相比明顯較為平坦(圖1B)。
圖1. 模型數(shù)據(jù) (A)截止2月10日各省確認(rèn)的COVID-19病例,數(shù)據(jù)來自https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_pc_3. (B)2020年春節(jié)假期湖北、廣東、浙江三省遷移率指數(shù)(實(shí)線-流入,虛線-流出)
SEIR是一種流行病學(xué)模型,此模型假設(shè)將人群劃分為四種狀態(tài):易感[S]、暴露或潛伏[E]、感染[I]或退出[R]來預(yù)測傳染性疾病動力學(xué)。每個狀態(tài)的人口比例由每個狀態(tài)之間的變化率決定:β ([S] 指向[E]或[S]指向[I]), σ ([E]指向[I]) 以及 γ ([I]指向[R])。參考每個省可用遷移指數(shù)(數(shù)據(jù)取至分析當(dāng)日),隨后根據(jù)我們的假設(shè)情況模擬往后日期的遷移指數(shù)。對于廣東省、浙江省、湖北省和中國(在模擬中,交通限制減弱),則使用了2019年的遷移指數(shù),而且認(rèn)為在[E]指向[S]的遷移率β1是[I]指向[S]的β2的5倍。
由于湖北省目前已實(shí)行嚴(yán)格檢疫措施,假設(shè)2月10日之后湖北省的遷移指數(shù)設(shè)為零。在2月12日之前,確診病例主要是基于PCR技術(shù)。在此基礎(chǔ)上,本模型預(yù)測將在2月20日達(dá)到單個流行高峰,存在42,792(95%CI 30,149–52,941)例現(xiàn)存確診病例。預(yù)計疫情在4月下旬趨于平緩,總病例數(shù)預(yù)估達(dá)到59,578 (95%CI 39,189–66,591)。如果延遲實(shí)施干預(yù)措施,疫情將在2月25日達(dá)到高峰,當(dāng)天前后預(yù)估有115,061例現(xiàn)存確診病例,暴發(fā)總?cè)藬?shù)會達(dá)到167,598例。如果提前5天采取干預(yù)措施,疫情預(yù)計在2月15日達(dá)到高峰,最終病例數(shù)將不會超過25,000(圖2)。
圖2. 改進(jìn)的SEIR模型預(yù)測曲線 (A)湖北省有嚴(yán)格管控,(B)湖北省減少管控力度,(C) 廣東省,(D) 浙江省和(E)中國在1月23日(藍(lán)色),5天后(灰色)和5天前(紅色)采取干預(yù)措施時的流行曲線,把每天現(xiàn)存確診病例的實(shí)際數(shù)據(jù)被擬合到曲線 (圓圈)上
然后,考慮湖北省減少隔離措施,公眾有一定程度的社會流動,由此假設(shè)r=10。預(yù)測結(jié)果發(fā)現(xiàn)有2月18日和3月11日這兩個流行高峰,分別有51,581(95%CI 39,874–63,994)和47,144(95%CI 36,305–58,484)例現(xiàn)存確診病例,最后疫情總規(guī)模將達(dá)到73,180 (95%CI 51,308–85,839)例。如果把干預(yù)措施實(shí)施延遲5天,暴露病例比例起初的增加將導(dǎo)致感染病例呈指數(shù)增長,流行峰值為2月21日和3月17日。截止4月末,仍可能存在30,000例以上的現(xiàn)存病例,而總病例數(shù)預(yù)估將會達(dá)到166,930例確診例數(shù)。如果提前5天實(shí)施干預(yù)措施,則疫情將在2月11日達(dá)到高峰,現(xiàn)存確診病例可能達(dá)到8,031例,疫情規(guī)模上升至15,965例 (圖2B)。
廣東省和浙江省不是疫情發(fā)源地,本研究預(yù)計廣東省和浙江省均在2月20日達(dá)到流行高峰,分別為1,202(95%CI 1,042–1,340)例和1,172(95%CI 1,004–1,314)例現(xiàn)存確診病例,且預(yù)計兩省的疫情將在4月中旬趨于平緩。廣東省和浙江省疫情最終規(guī)模預(yù)估分別達(dá)到1,511(95%CI 1,097–1,948)例和1,491(95%CI 1,066–1,851)例確診例數(shù)。如果政府延遲5天實(shí)施干預(yù)措施,廣東省和浙江省預(yù)計分別在2月26日和25日達(dá)到高峰,現(xiàn)存確診病例可能分別達(dá)到3,553例和3,522例,兩個省疫情的最終規(guī)??赡芫鶠?0,061例確診病例。如果政府提前5天實(shí)行干預(yù),疫情將得到有效控制(圖2C和D)。
二、全國疫情模型
1月23日實(shí)施控制措施后,COVID-19傳染幾率降低。一定數(shù)量易感人群的存在使平均每日新感染人數(shù)穩(wěn)定增加?;谀壳案深A(yù)措施,預(yù)計疫情將于2月28日達(dá)到高峰,現(xiàn)存確診病例達(dá)到59,764(95%CI 51,979–70,172)例。截至4月底趨于平緩,預(yù)計疫情最終規(guī)模預(yù)估共計122,122(95%CI 89,741–156,794)例。如果延遲5天實(shí)施干預(yù)措施,由于感染者平均每天接觸的次數(shù)增加,傳染系數(shù)(率)將會更大。病例數(shù)量呈指數(shù)增加,可能在3月4日達(dá)到高峰,達(dá)到173,372例現(xiàn)存確診病例,疫情最終規(guī)模預(yù)估為351,874例確診病例。如提前5天實(shí)施干預(yù)措施,全國疫情最終規(guī)模可能減少至40,991例確診病例 (圖2E)。
三、LSTM對中國疫情的預(yù)測
LSTM模型是一種遞歸神經(jīng)網(wǎng)絡(luò)(RNN),本研究基于2003年SARS流行病學(xué)數(shù)據(jù),納入COVID-19流行病學(xué)參數(shù)例如傳染概率、傳染系數(shù)(率)、潛伏率和退出率等進(jìn)行模型訓(xùn)練。根據(jù) LSTM模型預(yù)測,新增病例在2月4日達(dá)到高峰,到4月底預(yù)估有9.5萬例確診病例(圖3A)。隨后,我們對來自SEIR、LSTM以及中國每日新增病例數(shù)報告的數(shù)據(jù)繪制曲線。在1月22日至2月10日之間,新確診病例實(shí)際數(shù)量與LSTM預(yù)測數(shù)據(jù)的曲線之間顯著擬合(圖3B)。SEIR和LSTM模型均預(yù)測在2月4日到7日之間會出現(xiàn)每日新增病例高峰,達(dá)到4000例。SEIR模型還預(yù)測2月中下旬的每日新增病例可能有幾個新的小感染高峰出現(xiàn),這可能是返程人口流動及復(fù)工導(dǎo)致的。
圖3. (A)LSTM預(yù)測的全國COVID-19病例累計數(shù)量,(B)根據(jù)實(shí)際數(shù)據(jù)(紫色)、SEIR模型(橙色)和LSTM模型(綠色)計算的COVID-19新增病例數(shù)
討論
為了應(yīng)對1月15日開始暴發(fā)的COVID-19疫情,中國宣布啟動一級應(yīng)急響應(yīng)(最高級別公共衛(wèi)生響應(yīng)),在全國范圍內(nèi)實(shí)施了管控措施。除了封鎖武漢及其他鄰近地區(qū)以外,還要求必須嚴(yán)格報告往返湖北省的情況。同時,不鼓勵湖北居民返回工作地,而且即便是經(jīng)過武漢的非湖北居民,也被要求進(jìn)行14天的自我隔離。然而,武漢封城的有效性和必要性受到了質(zhì)疑,還有報道稱這樣的做法是否太晚[13-14]。Wu等學(xué)者預(yù)測,如果不采取控制措施,武漢的疫情規(guī)模將在1月25日達(dá)到17.5萬例,疫情將在4月達(dá)到高峰[13]。同樣,Read等人預(yù)測,在沒有控制措施的情況下,將在2月4日達(dá)到高峰,高達(dá)19萬例[14]。值得注意的是,他們預(yù)測到在武漢大規(guī)模封城的情況下,中國其他城市也仍將經(jīng)歷與武漢相似的疫情增長。然而,事實(shí)并非如此。廣東和浙江是受影響僅次于湖北的兩個省份,僅占全國PCR確診病例的6.6%。與武漢相比,這兩個省控制措施出臺相對較快。因此,相比于湖北,該兩省疫情增長放緩,說明了隔離和管控措施是有效的。本模型同樣預(yù)測,延后5天執(zhí)行控制措施將使疫情規(guī)模增加至3倍。
自本文分析以后,真實(shí)流行趨勢已證實(shí)與本研究預(yù)測曲線相吻合。在上周,廣東省和浙江省已報道每天的新增病例少于6例,而湖北的新增病例也同樣呈現(xiàn)下降的趨勢。對于廣東省和浙江省,移動人口已經(jīng)逐漸開始返程(由于依然存在限制,因此與前幾年返程相比,遷移率會相對較低),從而引發(fā)了潛在病例進(jìn)入的擔(dān)憂。目前只有湖北省依然有大量病例,其他省份遷移人口可能不會構(gòu)成重大風(fēng)險。廣東省和浙江省實(shí)行持續(xù)的早期發(fā)現(xiàn)與隨后進(jìn)行的隔離措施對于防止第二次流行高峰的出現(xiàn)是很有效的。
本研究強(qiáng)調(diào)的另一個關(guān)鍵點(diǎn)是放緩湖北省的檢疫限制將導(dǎo)致新的易感人群涌入,即春節(jié)后返程人員,將導(dǎo)致湖北省的疫情在3月11日左右出現(xiàn)另一個小高峰。大量資源應(yīng)被運(yùn)至湖北省來建設(shè)新的醫(yī)院和檢疫中心,以改善醫(yī)療護(hù)理及減少暴露風(fēng)險。以上所有的措施都可能減少傳播,并有助于緩和二次高峰出現(xiàn)的影響。
COVID-19的暴發(fā)引發(fā)了對人口密集城市公共衛(wèi)生流行病控制的重大挑戰(zhàn):決定何時實(shí)施控制措施。目前需要市或省疾控中心的陽性檢測結(jié)果以確診病例,這一過程至少需要30小時[15]。2月12日,湖北政府將根據(jù)影像學(xué)檢查、中性粒細(xì)胞計數(shù)和流行病學(xué)關(guān)聯(lián)等歸為臨床診斷病例,使得一夜之間增加了1.6萬例病例。但除了湖北省以外,其他省份都沒有采用這一分類方法,致使全國COVID-19確診病例數(shù)出現(xiàn)了混淆。盡管有人可能認(rèn)為臨床診斷病例并不完全準(zhǔn)確,但目前的PCR診斷方法也同樣存在不足[15]。直到有更進(jìn)一步確診的方法之前,如血清陽性率流行數(shù)據(jù)可用于評估真實(shí)發(fā)病率,本研究可以預(yù)見的是,基于PCR確診的流行曲線可能被低估。
圖3中的結(jié)果強(qiáng)調(diào)了我們研究中使用的兩種方法的優(yōu)點(diǎn)和弱點(diǎn)?;谠缙诘墓罍y,本SEIR模型使用了7天的潛伏期[2]。到目前,有報道證明潛伏期到癥狀發(fā)作的中位時間是3天[11],此病毒的潛伏期更接近于SARS-CoV的潛伏期,但可以從0到24天不等。我們測試了該模型對不同潛伏期的敏感性,發(fā)現(xiàn)較短的潛伏期會加速疫情高峰,但不會對疫情規(guī)模大小產(chǎn)生顯著影響。這可能解釋了真實(shí)曲線和LSTM預(yù)測曲線之間的顯著擬合,以及SEIR模型預(yù)測高峰滯后性問題。遺憾的是,用于機(jī)器學(xué)習(xí)的SARS流行病數(shù)據(jù)是來自2003年4月至6月,對于長期的預(yù)測來說這是個有限的數(shù)據(jù)庫。
本模型也沒有考慮到其他可能增加確診病例數(shù)的因素,如診斷能力。武漢市政府最近宣布了一項(xiàng)政策,要求對每一位疑似人員和返工人員進(jìn)行測試[16]。如果武漢市政府能夠提高檢測能力,盡量控制返回人員的流入量,但結(jié)果仍可能出現(xiàn)一個連續(xù)的高峰甚至第二個高峰。本研究的另一個局限性是我們無法考慮季節(jié)的影響。季節(jié)改變帶來的氣溫升高對于廣東非典疫情的消失很重要[17]。如果氣溫變化也適用于COVID-19,那么廣東的疫情將比浙江和湖北消失得更早。
結(jié)論
本SEIR優(yōu)化模型可精準(zhǔn)預(yù)測新冠病毒的流行趨勢,同時,人工智能預(yù)測模型已成功建立并且顯示與SEIR模型相似的趨勢,證實(shí)了1月23日起實(shí)施的公共衛(wèi)生干預(yù)措施有效控制了疫情發(fā)展。嚴(yán)格的防控措施如“早期篩查”最好實(shí)施至2020年4月底。
致謝
我們感謝橫琴鯨準(zhǔn)智慧醫(yī)療科技有限公司的成于伽、紀(jì)冰怡和許碧峰的技術(shù)支持。
表1. 本研究預(yù)測結(jié)果總結(jié)
a假設(shè)湖北省仍然嚴(yán)格管控,沒有返程高峰b假設(shè)湖北省減少管控,有返程高峰
(注:英文原文附文章補(bǔ)充方法的說明)。
參考文獻(xiàn)
1. Zhou P, Yang X-L, Wang X-G, Hu B, Zhang L, Zhang W, et al. A pneumonia outbreak associated with a new coronavirus of probable bat origin. Nature. 2020:10.1038/s41586-020-2012-7.
2. Li Q, Guan X, Wu P, Wang X, Zhou L, Tong Y, et al. Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus-Infected Pneumonia. The New England journal of medicine. 2020.
3. Real-time big data report on the epidemic (in chinese) 2020 [Available from: https://voice.baidu.com/act/newpneumonia/newpneumonia/?from=osari_aladin_top1].
4. Coronavirus disease 2019 (COVID-19) Situation Report –25 2020 [Available from: https://www.who.int/docs/default-source/coronaviruse/situation-reports/20200214-sitrep-25-covid-19.pdf?sfvrsn=61dda7d_2].
5. Situation Updates - SARS: Update 95 - Chronology of a serial killer 2003 [Available from: https://www.who.int/csr/don/2003_06_18/en/].
6. 2019 Data from spring festival (in chinese) 2019 [Available from: http://news.sina.com.cn/c/2019-02-04/doc-ihrfqzka3579637.shtml].
7. Situation report (in chinese) 2020 [Available from: http://www.nhc.gov.cn/xcs/yqtb/list_gzbd.shtml].
8. Baidu qianxi (in chinese) 2020 [Available from: https://qianxi.baidu.com/.
9. Combatting SARS (in chinese) 2003 [Available from: http://news.sohu.com/57/26/subject206252657.shtml].
10. Guan W-j, Ni Z-y, Hu Y, et al. Clinical characteristics of 2019 novel coronavirus infection in China. 2020.
11. Backer JA, Klinkenberg D, Wallinga J. Incubation period of 2019 novel coronavirus (2019-nCoV) infections among travellers from Wuhan, China, 20-28 January 2020. Euro Surveill. 2020;25(5).
12. Wang W, Tang J, Wei F. Updated understanding of the outbreak of 2019 novel coronavirus (2019-nCoV) in Wuhan, China. J Med Virol. 2020;92(4):441-7.
13. Wu JT, Leung K, Leung GM. Nowcasting and forecasting the potential domestic and international spread of the 2019-nCoV outbreak originating in Wuhan, China: a modelling study. The Lancet. 2020.
14. Read JM, Bridgen JRE, Cummings DAT, Ho A, Jewell CP. Novel coronavirus 2019-nCoV: early estimation of epidemiological parameters and epidemic predictions. 2020.
15. Novel coronavirus diagnosis and treatment protocol (in chinese) 2020 [Available from: http://www.nhc.gov.cn/xcs/zhengcwj/202002/d4b895337e19445f8d728fcaf1e3e13a/files/ab6bec7f93e64e7f998d802991203cd6.pdf].
16. Pneumonia epidemic prevention and control work of new coronavirus deployed in our city 2019 [Available from: http://www.wuhan.gov.cn/2019_web/whyw/202001/t20200123_304083.html].
17. Lin K, Yee-Tak Fong D, Zhu B, Karlberg J. Environmental factors on the SARS epidemic: air temperature, passage of time and multiplicative effect of hospital infection. Epidemiol Infect. 2006;134(2):223-30.
本文轉(zhuǎn)載自“AME科研時間”