大數(shù)據(jù)是怎么知道你去過新發(fā)地的?
“經(jīng)過全市大數(shù)據(jù)分析,您可能在5月30日(含)以后去過新發(fā)地批發(fā)市場……”隨著新發(fā)地市場新冠源頭被鎖定,近日來,大數(shù)據(jù)篩查,成為不少北京市民在朋友圈中熱議的話題
本文引用地址:http://www.ex-cimer.com/article/202006/414928.htm一組數(shù)據(jù)顯示,截止6月17日,在行動軌跡一致的情況下,利用大數(shù)據(jù)分析相關(guān)風險人群位置和路徑,北京用了短短幾天時間,就“找”出了30多萬人進行核酸檢測。與年初武漢疫情爆發(fā)初期大數(shù)據(jù)分析人口流動相比,此次北京的“大數(shù)據(jù)篩查”,無疑體現(xiàn)了更高的技術(shù)含量,和更好的時效性,對疫情處置發(fā)揮了不可小覷的作用。
圖片顯示了5月29到6月12日到訪過新發(fā)地的人群,發(fā)現(xiàn)2430人到訪新發(fā)地市場并離開北京,其中有91人到訪上海。圖表還詳細列出了這2000多人到訪過的其他城市,包括廊坊、保定、天津等。(圖片來自網(wǎng)絡(luò))
精準查找
三種手段鎖定新發(fā)地接觸者
從6月15日以來,不少路過或者去過新發(fā)地的北京市民,都接到了短息或者是社區(qū)電話,表示通過大數(shù)據(jù)篩查,確認被調(diào)查者近期去過或者路過新發(fā)地市場,要求如實填報信息,并盡快進行核酸檢測。
那么,什么是“大數(shù)據(jù)篩查”?大數(shù)據(jù)又是怎樣找到新發(fā)地的路過者呢?大數(shù)據(jù)在此次疫情防控中起到了什么作用?
大數(shù)據(jù),顧名思義其實就是海量、大量的資料,這些資料來源于隨時產(chǎn)生的數(shù)據(jù);而大數(shù)據(jù)又分為狹義和廣義兩種;狹義的大數(shù)據(jù)包括個人私人信息、購物習(xí)慣、閱讀習(xí)慣等個人畫像;而廣義的大數(shù)據(jù)則是針對社會或者企業(yè)的,例如電商利用大數(shù)據(jù)分析顧客購物習(xí)慣,做好需求預(yù)測,提前布局好倉庫存儲等等。
顯而易見的是,此次新發(fā)地的“大數(shù)據(jù)篩查”,就是廣義大數(shù)據(jù)與狹義大數(shù)據(jù)的一次有機融合,也是海量存儲和快速檢索技術(shù)的一次良好利用。
盡管官方并未公布大數(shù)據(jù)篩查的具體方法,但中科曙光大數(shù)據(jù)總工程師首席科學(xué)家、存儲產(chǎn)品事業(yè)部副總經(jīng)理宋懷明博士分析認為,北京之所以能夠?qū)崿F(xiàn)利用大數(shù)據(jù)快速排查篩選新發(fā)地到訪者,有三種技術(shù)路徑可以實現(xiàn)。
首先是基于手機移動數(shù)據(jù)確定位置信息,也叫基源定位方法,這是最常用的方法,也是此次新發(fā)地大數(shù)據(jù)篩查當中,效率最高的手段:不過基源并不是GPS,而是通過手機基站,與GPS使用時才打開不同,手機會自動連接到距離最近的信號發(fā)射塔,手機的所有活動,都能通過包含基站信息的信令數(shù)據(jù)信號發(fā)射塔篩查回溯,這為追蹤使用者的位置定位及路徑追蹤,提供了真實準確的第一手數(shù)據(jù)。
其次是通過社會交往信息分析,這并不是指通過社交軟件信息判斷,而是結(jié)合已有數(shù)據(jù),通過電話調(diào)查、摸排走訪等方式,最終形成相對可靠的數(shù)據(jù)信息,也可以在短時間內(nèi)篩選出哪些人在新發(fā)地工作、哪些人曾經(jīng)去過新發(fā)地、他們這幾天密切接觸了什么人等等。
第三種方法是可以通過物品信息確認,此次新發(fā)地篩查過程中,除了對經(jīng)過者、密切接觸者的篩查,也排查了不少物品和貨品,在這個過程當中,通過對特定攜帶病毒物品的路徑和接觸者追蹤,同樣可以作為排查查找到新發(fā)地密切接觸者的依據(jù)之一。但宋懷明強調(diào),這種篩查方法的數(shù)據(jù)可能并不完全,而新發(fā)地是否真的利用查物的方法尋找接觸者,目前也不能完全確定。
在官方正式回應(yīng)以外,此前網(wǎng)上還流傳著一種是說法“支付寶和微信提供數(shù)據(jù),鎖定35萬人,幫助病毒篩查”但這則消息很快就被兩方進行了官方辟謠。
對此,宋懷明認為,通過二維碼獲取交易記錄,可以確定交易用戶位置。但對于交易用戶的行動路徑追蹤,無論是支付寶和微信都無法實現(xiàn)。此外,新發(fā)地作為農(nóng)產(chǎn)品大宗批發(fā)市場,還有很多其他交易方式是通過線上轉(zhuǎn)賬或者現(xiàn)金的方式進行,因此支付寶微信數(shù)據(jù),最多只能在大數(shù)據(jù)篩查當中起到一定的輔助作用。
技術(shù)革新
大數(shù)據(jù)助力流行病精準防控
除了篩查接觸到訪者,此次新發(fā)地疫情當中,大數(shù)據(jù)還起到了怎樣的作用?中國疾控中心首席專家吳尊友告訴北京科技報記者,在他看來,此次北京新發(fā)地新冠疫情過程中,大數(shù)據(jù)至少發(fā)揮了兩方面作用:一是將早期病例精準鎖定到新發(fā)地市場,及時發(fā)現(xiàn)傳染源,為疾病控制贏得了寶貴的時間。
二是對發(fā)現(xiàn)疫情以后,在去過高風險地區(qū)向外流動的人員的了解“包括暴露于環(huán)境,和接觸的人員,和密切接觸者,在北京的分布,以及留出北京的情況,對于發(fā)現(xiàn)潛在感染者,阻斷傳播,起到了非常大的作用?!?/p>
實際上,不僅是北京新發(fā)地,在此次新冠肺炎疫情過程中,尤其是年初武漢疫情爆發(fā)之時,大數(shù)據(jù)篩查和分析,就對于疾病防控起到了相當重要的作用。
北京此次做到了精準分級,沒有‘一刀切封城’,而以街道為單位劃分風險等級,進行分級管控,大數(shù)據(jù)起到了關(guān)鍵的作用
疫情爆發(fā)之后,數(shù)家科技互聯(lián)網(wǎng)公司陸續(xù)通過數(shù)據(jù)和技術(shù)能力,給全社會提供了大量數(shù)據(jù)支撐;例如百度的遷徙數(shù)據(jù),精準計算出離開武漢和滯留武漢的人數(shù),為政府防控提供了決策參考;再比如12306票務(wù)平臺,利用實名制售票的大數(shù)據(jù)優(yōu)勢,及時配合地方政府及各級防控機構(gòu),第一時間提供了確診病人車上密切接觸者信息。
此外,利用大數(shù)據(jù)技術(shù)實現(xiàn)信息共享、快速查詢,很多媒體平臺和互聯(lián)網(wǎng)平臺紛紛開辟了新冠肺炎動態(tài)更新、疫情展示和辟謠功能,使用者在魚龍混雜的信息當中回歸理性,讓權(quán)威信息“跑”在謠言前面,及時安撫了公眾情緒,從另一個層面“抑制”了病毒蔓延。
在預(yù)防層面,針對人員聚集可以進行預(yù)警;在擴散源頭方面,把數(shù)學(xué)模型和人員社交特征結(jié)合,可以很好分析擴散路徑與速度,制定更有針對性的對策與措施“北京此次做到了精準分級,沒有‘一刀切封城’,而以街道為單位劃分風險等級,進行分級管控。”宋懷明認為,這都是大數(shù)據(jù)起到了重要的作用。
與國內(nèi)相比,在大數(shù)據(jù)預(yù)測分析流行病方面,國外已經(jīng)有了比較成熟的探索和實踐,早在2008年,谷歌便發(fā)布了“Google Flu Trends”(谷歌流感趨勢),利用關(guān)鍵詞追蹤技術(shù)搜集數(shù)據(jù),如果在某一地區(qū)的某一時間段內(nèi),有大量關(guān)于流感、發(fā)熱、感冒等關(guān)鍵詞的搜索,就表明此地存在潛在的感染人群,需要引起相關(guān)部門的重視。
谷歌曾經(jīng)開發(fā)了軟件,利用大數(shù)據(jù)分析流感趨勢,但最終以失敗告終(圖片來自網(wǎng)絡(luò))
2009年,墨西哥爆發(fā)的豬流感,研究人員也曾利用通信數(shù)據(jù)監(jiān)測,從而獲取公眾對于政府發(fā)布的健康預(yù)警信息的反應(yīng),以指導(dǎo)有關(guān)部門更好調(diào)整政策;2014年埃博拉疫情在西非爆發(fā),研究人員同樣基于手機通信數(shù)據(jù)建模,對傳染病的流行進行了判斷與分析。
不難發(fā)現(xiàn),有了大數(shù)據(jù)+人工智能加持的公共衛(wèi)生領(lǐng)域:一方面在行動效率上更高更快,有效減緩了傳染病的傳播與擴散;另一方面,同樣可以起到,提供預(yù)測與分析的重要作用。
未雨綢繆
大數(shù)據(jù)應(yīng)用如何“更高、更快、更強”?
新冠疫情情暴發(fā)后,大數(shù)據(jù)在疫情排查等方面得到迅速應(yīng)用,國內(nèi)各領(lǐng)域、行業(yè)、機構(gòu)、部門紛紛利用大數(shù)據(jù)技術(shù),加強互聯(lián)互通,加速了整個社會力量的整合,對疫情處置發(fā)揮了不可小覷的作用。
但大數(shù)據(jù)應(yīng)用并非完美體,隨著疫情應(yīng)對的深入,它也暴露出了不少短板,和仍需提高完善的之處。
首先是準確性問題,從目前的技術(shù)水平來看,大部分城市的大數(shù)據(jù)應(yīng)用,聚焦在城市日常生活管理場景、基礎(chǔ)保障場景,例如在金融領(lǐng)域、安防領(lǐng)域、交通規(guī)劃領(lǐng)域等等;但在疫情期間,需要尋求解決方案的“突發(fā)公共衛(wèi)生事件場景”,不可控的因素較多,很容易讓一些常規(guī)算法暴露短板,甚至出現(xiàn)數(shù)據(jù)不準確的問題。
例如此次新發(fā)地防疫過程當中,由于大數(shù)據(jù)信息無法準確分辨“去過”和“路過”新發(fā)地市場的區(qū)別,加上可操作時間較短,最終出現(xiàn)了“一刀切”的情況,有些乘坐公共交通工具途徑新發(fā)地的市民,也收到了要求進行核酸檢測的短信或通知,讓人頗感意外。
對此吳尊友認為,大數(shù)據(jù)篩查過程當中,由于時間較短,精力有限,的確存在一些錯誤判斷的情況,有些沒有危險暴露的市民,也被要求填寫信息檢測核酸“但數(shù)量只是一小部分,目前首要任務(wù)還是控制疫情,未來還有改進提高的空間?!?/p>
宋懷明也認為,除了發(fā)短信以外,排篩查的手段也包括打電話、上門走訪和自我填報等等,目的就是為了最大程度減少在突發(fā)公衛(wèi)事件當中,大數(shù)據(jù)應(yīng)用的不準確性和不確定因素。
其次是大數(shù)據(jù)決策問題,宋懷明表示,從實際效果來看,大數(shù)據(jù)目前的作用,更多地依然停留在分析和輔助決策方面,只有很少一部分能夠進行自動決策“從數(shù)據(jù)角度來看,這樣的做法是更科學(xué)的,但從時間和效率來看,這樣的手段依然有較大待提升提高空間?!?/p>
出于防控需要,很多人的個人信息被“暴露”在APP、小程序或是登記單、記錄本當中,哪些是合理采集,哪些又屬于過度采集,如果個人信息泄露了怎么辦?目前依然有待商榷(圖片來自網(wǎng)絡(luò))
在數(shù)據(jù)立法、數(shù)據(jù)安全方面,相關(guān)法律法規(guī)也不夠健全:記者了解到,國家層面目前還沒有出臺針對公共數(shù)據(jù)管理的法律法規(guī),省市層面也基本處于各自為戰(zhàn)的局面,一些地方出臺了法律條例,一些地方僅僅出臺了規(guī)章辦法,還有一些地方并未就此立法。
這在無形中給數(shù)據(jù)安全和個人隱私性,帶來了不確定因素——疫情期間,多地出現(xiàn)了個人隱私泄露事件,引發(fā)了公眾的擔憂;出于防控需要,很多人的個人信息被“暴露”在APP、小程序或是登記單、記錄本當中,哪些是合理采集,哪些又屬于過度采集,如果個人信息泄露了怎么辦?目前依然有待商榷,
實際上,加強信息共享,消除信息孤島,同時做好個人隱私和數(shù)據(jù)安全的保護,不僅對當下抗擊疫情至關(guān)重要,對實現(xiàn)政府決策科學(xué)化、社會治理精準化、公共服務(wù)高效化也有巨大的推動作用。
“未來要著力規(guī)范數(shù)據(jù)的所有權(quán)、使用權(quán)和使用規(guī)范,要保護好公眾的隱私和數(shù)據(jù)安全?!彼螒衙鲝娬{(diào),有關(guān)部門既要把握好公眾知情權(quán),與保護公眾隱私之間的關(guān)系“也要盡可能的把公眾關(guān)心的數(shù)據(jù)全面、及時、準確地發(fā)布出來,并充分調(diào)動社會力量積極參與,形成大數(shù)據(jù)共享的合力”。
評論