「政府巨量資料應用研究計畫」
建立跨部會資料共享和應用加值機新契機
巨量資料的應用受到世界各國政府及研究機構的極度重視,對於擁有長期累積大量資料的政府機構而言,找出資料的價值,萃取可用的資訊,善加運用巨量資料分析的結果,將可對政府施政產生直接而有效的幫助。有鑑於此,科技部去年(104年)邀請學界結合應用領域及資訊領域學者激盪創意,共同進行政府巨量資料的應用研究;一方面由學者自由發想,構思巨量資料在政府施政上適合的應用情境,透過研究計畫的執行加以驗證。另一方面我們也在「部會出題、學界解題」的精神下,協調政府部會規劃健康照護、毒藥品防制、自然環境保護、災害預警、治安維護、矯正教化、居住正義、原住民生活發展、提升薪資、賦稅合理等應用議題之待解決課題與詳細應用情境,導入學研界研究能量,結合衛福部、內政部、法務部、教育部、財政部、經濟部、交通部、科技部、勞動部、環保署等部會的資料,進行分析研究,作為政府擬定相關政策的參考。
科技部政府巨量資料應用研究計畫,在張善政與徐爵民兩任部長先後的推動下,目前產出階段性的重點成果摘要如下:
1.運用教育雲教育大市集的資料進行統計分析,透過視覺化的方式,呈現各縣市學校的教育大市集資源使用率與分佈,提供教育主管單位瞭解教材資源的使用趨勢,並且可以透過熱門教材的推薦,協助教師取得合適的教學資源。另外,也將去識別化後的教師使用行為模式進行分析同時以視覺化方式呈現,協助教育主管單位瞭解教師與教育大市集教材的關聯性,分析教師的教材搜尋模式,預測教師的教材使用趨勢,並提供教師適性化的教材推薦。
2.將醫療、環境、氣候之相關資料整合建立「醫療/環境異質大數據分析平台」,進行氣候與空污因子對呼吸道之樣型分析、顱內出血危險族群及關鍵環境因子分析、空氣汙染成因之疾病就診動態即時分析、空氣汙染影響疾病就醫之動態時間延遲分析等,瞭解呼吸道疾病及顱內出血之易受害族群,做為疾病預防之參考;並動態分析空污影響疾病就醫之延遲效應,將可提供醫療照護與疾病預防上的個人化指標。
3.使用社群網路資料庫做為社群網路來源資料基礎,透過彙整及分析社群網路,擷取出災情相關的資訊,並繪製成為地理資訊,並以時序的方式呈現在社群網路災情綜整平台。未來可結合國家災害防救科技中心的災害防救資料,制定社群災害防救資料標準以及自動化資訊分析技術,以完善災前整備、災中應變或災害重建之應用。
4.結合衛福部的健康資料及環保署的環境資料,評估空氣污染暴露對人體健康影響,並優化空氣汙染暴露與民眾氣喘急診、心肌梗塞住院的預測能力。未來可持續運用已建立之巨量資料分析策略,彙整環境及健康資料中多項異質性資訊,建立以健康為基礎之環境空氣指標(Air Quality Health Index, AQHI),依此指標評估並預測環境中空氣污染暴露對於民眾健康之影響。
5.運用刑案資料,以地點為單位進行犯罪研究,將可能之犯罪地點製作出「治安熱點圖」,並建立標準分析程序,供警政單位製作不同之「治安熱點圖」,並由視覺分析協助判定犯罪發生因子,作為預防犯罪之參考。
這次學界對於政府資料的分析研究,已初步展現了政府資料在教育、防疫醫療、災害防救、犯罪防治等應用領域的應用價值。未來,科技部期望建立跨部會資料共享和應用的加值機制,在符合個人隱私和倫理規範等前提下,催生巨量資料的創新研究與應用。我們預期未來將帶動更多的研究,擴大政府資料加值效益。