請問唐鳳:社工幫政府建資料,有需求卻拿不到?
勵馨基金會執行長紀惠容:
政府期待婦女服務(尤其是保護性服務)的資料全部都登錄中央資料庫,並且很霸權地以此綁補助,輸入資料才給補助,我們覺得這個要求並不合理,但幾次溝通都不得其門而入。
第一,它的目的不清,它以「大數據」為名,但是根本沒有大數據的分析。
第二,我們輸入政府資料庫的資料自己無法保留。輸入資料對第一線人員是苦工,我們不可能要求這些工作量極大的社工既輸入政府資料庫、又輸入我們自己的資料庫。但是進政府資料庫的資料我們無法下載使用,這表示,只要我們要接政府的保護性服務,就必須捨棄自己的資料累積,放棄從資料做統計分析、發展專業。
第三,個案的隱私沒有被保護。
唐鳳:
我們之前做「民生公共物聯網」協調的時候,那個協調起來比較容易,因為那個是空氣、水品質--環境不會主張個資--但是也碰到非常多問題,也就是災害發生的時候,救災都已經來不及了,還要填3個系統,疏散、收容及開設的時候,如果要紙本填一次、消防署填一次、地方政府填一次--地方很多是志工,並不是有薪水的--光是做這一些就沒有時間救災,所以這個是我完全了解。
我這邊想要講兩個:
第一,我們在協調民生公共物聯網時,作法很簡單,就是讓中央系統的接口是透明的,只要系統能夠符合這樣的格式,不會要求各單位要到中央的前端填資料。系統後端可以是一致的格式,一致的格式也有助於民間救災團隊彼此協調資料,一致的格式大家並不會反對。
大家會有疑慮的,是不開放的格式、單方面修改,然後治理的過程並沒有辦法參與,所以自己建置的系統也沒有辦法介接上去,到最後就會變成放棄掉自己的系統,大家反對的是這個結構。
我們協調的基本原則是,如果政府有正當的依據請民間填寫資料,應該要有一個機器可以寫入的接口,現在有一個專門的名詞是OpenAPI,就是把機器當作特殊境遇的使用者。我的比喻是,你的網頁必須讓盲人也可以透過點字或者是語音合成方法來取用,如果在招標時,資訊廠商說我的網頁只給明眼人看,這就是要在有利標刷掉,或甚至不應該進入投標程序。
政府資料庫,要讓機器人也能讀寫
今年開始,《政府數位服務準則》裡,在開標案時候,可以載明對於資料庫的系統,機器人也是一種用戶。如果機器不能讀寫的話,就像歧視盲人一樣,如果機器要讀寫,廠商希望收額外的錢的話,這個廠商就不專業,就不可以進入最有利標的系統。中央機關可以用這個理由,讓這個廠商取消資格。
我們等於透過新的資訊服務採購契約範本,讓中央機關了解,當你做資訊建置或採購時,留下這個接口,對於未來下一手廠商接手或是讓民間填了之後,機器對機器填上來,這都只有好處、沒有壞處。如果系統整合商做不到,那是他的問題,並不是政府的問題。所以這是很明確的要求。
衛福部的朋友,當時宣導會議都有來,因此我們可以來談這個資料庫在下次招標,是不是已經有這樣的接口。我們之前跟衛福部已經協調過避難收容的子系統,很多民間都有一套自己填寫的方法,本來就是批次拋轉就可以了。
但是當時的廠商,本來契約上確實沒有明文要求接受機器拋轉。所以我們在新的採購契約範本上面,不管是工程會的採購、國發會的資訊管理,都有明確的文字來講這個。這個確實是要傳達到廠商的合約書裡面,只要有傳達到的話,就需要開出這個機器可讀寫的接口。這個是容易的,我們很願意約一個時間來聊一下。
只有個案本人可以下載資料
至於個資重新下載讓你們使用,這大概沒辦法,我現在就可以說不可能。因為一開始是依法、依特定業務而為蒐集,依照《個資法》,理論上可以下載的只有個案本人。當事人不只是可以要求副本、補充、更正而已,在目的消滅的時候,當事人可以請求刪除。
現在就算是同一個NGO,但是從部會的角度來看,當初上傳跟現在下載的未必能代表同一個主體。當初個案有充分告知願意提供,但下一手承辦不一定有取得個案的授權。所以從部會的角度來看,只要是個資,當時就算是我委託你代為蒐集,也不表示你未來就可以批次下載回去,除非有明文約定,不然很明確是不可以的。
最後是隱私,服務社工有告知個案資料會被輸入政府資料庫的義務。政府單位則是採取部會分管原則,個資必須要有特定目的業務,才會根據業務蒐集。要跨業務調用個案資料,只有在一個情況,也就是個案危險、緊急的情況。
即便是研究者申請做數據分析,也不會個別資料,而是統計資料。應該說,若要做數據分析,研究者在意的是趨勢,以及其中呈現的長期關連。所以這些研究者,大概不會對哪個人的隱私很有興趣。
衛福部我沒有那麼熟,但以我的理解,像財政部的情況,財政部資訊中心的全面性做法,會先做一個基本最小統計來當作單位,釋出資料,學界在最小統計區裡面,大家有針對所得、移出移入等等研究。
過程中財政部把任何會侵犯到個資的,像裡面如果只有一個人的所得會在這麼高的分位,這個會拿掉,因為這筆資料很容易逆推出這個人的身分。
這個處理過程,會讓學界反應說很難用,因為算平均數、中位數都不一樣,犧牲太多的可用性。
針對「作為研究資料不好用」的抱怨,財資中心的做法是讓學者提供他要研究的演算法,財資中心不是把原始資料交給學者,而是把統計演算法在自己的資料庫跑,統計出的資料再交給大家、交給學術研究單位,但誰都拿不到原始的個資。
總而言之,最好的方法是NGO之間有一套開放的、大家可以一起參與治理填寫的系統,這個是在MGO這邊維運,但是資料可以拋轉到政府資料庫,我可以協調到這裡。
(錄音逐字稿整理:薛雅婷)
推薦文章