AI 助陣醫學、防疫,個人隱私難兩全?
2021/06/09 研之有物
規範不完備是臺灣個資保護的一大隱憂,《個資法》問世遠早於 AI 時代、去識別化定義不清、缺乏獨立專責監管機構,都是當前課題。
評論
本篇來自合作媒體研之有物,作者周玉文、黃曉君,INSIDE 經授權轉載。
AI 醫療、科技防疫的人權爭議
健康大數據、人工智慧(AI)已經成為醫療研發的新聖杯,新冠肺炎(COVID-19)更將 AI 技術推上防疫舞臺,各國紛紛串聯大數據監控足跡或採用電子圍籬。但當科技防疫介入公衛醫療,我們是否在不知不覺中讓渡了個人隱私?
中研院歐美研究所副研究員何之行認為,規範不完備是臺灣個資保護的一大隱憂,《個資法》問世遠早於 AI 時代、去識別化定義不清、缺乏獨立專責監管機構,都是當前課題。
「天網」恢恢,公衛醫療的新利器
自 2020 年新冠疫情大爆發,全世界為了因應危機展開大規模協作,從即時統計看板、預測病毒蛋白質結構、電子監控等,大數據與 AI 技術不約而同派上用場。但當數位科技介入公共衛生與醫療健康體系,也引發人權隱私的兩難爭議。
2020 年的最後一夜,臺灣再次出現本土案例。中央流行疫情指揮中心警告,居家隔離、居家檢疫、自主健康管理的民眾,都不應參加大型跨年活動。而且,千萬別心存僥倖,因為「天網」恢恢,「我們能找得到您」!有天網之稱的電子圍籬 2.0 出手,許多人拍手叫好,但也挑起國家進行隱私監控的敏感神經。
隱私爭議不只在防疫戰場,另一個例子是近年正夯的精準醫療。2021 年 1 月,《經濟學人》(The Economist)發布亞太區「個人化精準醫療發展指標」(Personalised-health-index)。臺灣勇奪亞軍,主要歸功於健全的健保、癌症資料庫及尖端資訊科技。
國際按讚,國內反應卻很兩極。早前曾有人質疑「個人生物資料」的隱私保障,擔憂是否會成為藥廠大數據;但另一方面,部分醫療研究者卻埋怨《個人資料保護法》(簡稱《個資法》)很嚴、很卡,大大阻擋了醫學研發。為何國內反應如此分歧?
中研院歐美所副研究員何之行認為,原因之一是,
《個資法》早在 2012 年就實施,跑在 AI 時代之前,若僅僅仰賴現行規範,對於新興科技的因應恐怕不合時宜。
健保資料庫爭議:誰能再利用我們的病歷資料?
來看看曾喧騰一時的「健保資料庫訴訟案」。
2012 年,臺灣人權促進會與民間團體提出行政訴訟,質疑政府沒有取得人民同意、缺少法律授權,逕自將健保資料提供給醫療研究單位。這意味,一般人完全不知道自己的病例被加值運用,侵害了資訊自主權。案件雖在 2017 年敗訴,但已進入大法官釋憲。
民間團體批評,根據《個資法》,如果是原始蒐集目的之外的再利用,應該取得當事人同意。而健保資料原初蒐集是為了稽核保費,並非是提供醫學研究。
但支持者則認為,健保資料庫是珍貴的健康大數據,若能串接提供學術與醫療研究,更符合公共利益。此外,如果過往的數據資料都必須重新尋求全國人民再同意,相關研發恐怕得被迫踩剎車。
種種爭議,讓醫學研究和資訊隱私之間的紅線,顯得模糊而舉棋不定。何之行指出,「個人權利」與「公共利益」之間的權衡拉鋸,不僅是長久以來政治哲學家所關心的課題,也反映了現代公共衛生倫理思辨的核心。
我們有權拒絕提供資料給醫療研究嗎?當精準醫療的腳步飛也似向前奔去,我們要如何推進醫學科技,又不棄守個人的隱私權利呢?
「精準醫療」與「精準健康」是近年醫學發展的重要趨勢,透過健康大數據來評估個人健康狀況,對症下藥。但健康資料涉及個人隱私,如何兼顧隱私與自主權,成為另一重要議題。
去識別化爭點:個資應該「馬賽克」到什麼程度?
何之行認為,「健保資料庫爭議」短期可以從幾項原則著手,確立資料使用標準,包括:允許退出權(opt-out)、定義去識別化(de-identification)。
「去識別化」是一道安全防護措施。簡單來說:讓資料不會連結、辨識出背後真正的那個人。何之行特別分享 Google 旗下人工智慧研發公司 DeepMind 的慘痛教訓。
2017 年,DeepMind 與英國皇家醫院(Royal Free)的協定曝光,DeepMind 從後者取得 160 萬筆病歷資料,用來研發診斷急性腎衰竭的健康 APP。聽來立意良善的計畫,卻引發軒然大波。原因是,資料分享不僅未取得病患同意,也完全沒有將資料去識別化,每個人的病史、用藥、就醫隱私全被看光光!這起爭議無疑是一大教訓,重創英國社會對於開放資料的信任。
回到臺灣脈絡。去識別化指的是以代碼、匿名、隱藏部分個資或其他方式,無從辨識特定個人。但要達到什麼樣的隱匿保護程度,才算是無從識別特定個人?
何之行指出,個資法中的定義不甚清楚,混用匿名化(anonymous)、假名化(pseudonymised)、去連結(delink)等規範程度不一的概念。臺灣也沒有明確定義去識別化標準,成為爭點。
現行法令留下了模糊空間,那麼他山之石是否能提供參考?
以美國《健康照護可攜法案》(HIPAA)為例,法案訂出了去除 18 項個人識別碼,作為去識別化的基準;歐盟《一般資料保護規則》則直接說明,假名化的個資仍然是個人資料。
退出權:保留人民 say NO 的權利
另一個消解爭議的方向是:允許退出權,讓個人保有退出資料庫的權利。即使健保資料並沒有取得民眾事前(opt-in)的同意,但仍可以提供事後的退出選項,民眾便有機會決定,是否提供健康資料做學術研究或商業運用。
何之行再舉英國國民健保署 NHS 做法為例:英國民眾有兩階段選擇退出中央資料庫 (NHS Digital)的機會,一是在一開始就拒絕家庭醫師將自己的醫病資料上傳到 NHS Digital,二是資料上傳後,仍然可以在資料分享給第三方使用時說不。畢竟有人願意為公益、學術目的提供個人健康數據,對商業用途敬謝不敏;也有人覺得只要無法辨識個人即可。
近年,英國政府很努力和大眾溝通,希望民眾認知到資料分享的共善,也說明退出所帶來的社會成本,鼓勵人們留在資料庫內,享受精準醫療帶給個人的好處。可以看到英國政府藉由公眾溝通,努力建立社會信任。
參照英國經驗,目前選擇退出的比率約為 2.6%。保留民眾某種程度的退出權,但善盡公眾溝通,應是平衡集體利益與個人隱私的一種做法。
歐盟 GDPR 個資保護的四大原則
健保資料庫只是案例之一,當 AI 成為大數據浪潮下的加速器,最周全之策仍然是針對 AI 時代的資料運用另立規範。 歐盟 2018 年實施的《一般資料保護規則》(General Data Protection Regulation,以下簡稱 GDPR),便是大數據 AI 時代個資保護的重要指標。
因應 AI、大數據時代的變化,歐盟在 2016 年通過 GDPR,2018 年正式上路,被稱為「史上最嚴格的個資保護法」。包括行動裝置 ID、宗教、生物特徵、性傾向都列入被保護的個人資料範疇。
歐盟在法令制定階段已將 AI 運用納入考量,設定出個資保護四大原則:目的特定原則、資料最小化、透明性與課責性原則。
其中,「目的特定」與「資料最小化」都是要求資料的蒐集、處理、利用,應在特定目的的必要範圍內,也就是只提供「絕對必要」的資料。
然而,這與大數據運用需仰賴大量資料的特質,明顯衝突!
大數據分析的過程,往往會大幅、甚至沒有「特定目的」的廣蒐資料;資料分析後的應用範圍,也可能超出原本設定的目標。因此,如何具體界定「特定目的」以及後續利用的「兼容性判斷」,便相當重要。這也突顯出「透明性」原則強調的自我揭露(self-disclosure)義務。當蒐集方成為主要的資料控制者,就有義務更進一步解釋那些仰賴純粹自動化的決策,究竟是如何形成的。
「透明性原則的用意是為了建立信任感。」何之行補充。她舉例,中國阿里巴巴集團旗下的芝麻信用,將演算法自動化決策的應用發揮得淋漓盡致,就連歐盟發放申根簽證都會參考。然而,所有被納入評分系統的人民,卻無從得知這個龐大的演算法系統如何運作,也無法知道為何自己的信用評等如此。
芝麻信用表示,系統會依照身分特質、信用歷史、人脈關係、行為偏好、履約能力等五類資料,進行每個人的信用評分,分數介於 350-950。看似為電商系統的信用評等,實則影響個人信貸、租車、訂房、簽證,甚至是求職。
這同時涉及「課責性」(accountability)原則 ── 出了問題,可以找誰負責。以醫療場域來講,無論診斷過程中動用了多少 AI 工具作為輔助,最終仍須仰賴真人醫師做最後的專業判斷,這不僅是尊重醫病關係,也是避免病患求助無門的問責體現。
科技防疫:無所遁形的日常與數位足跡
當新冠疫情爆發,全球人心惶惶、對未知病毒充滿恐懼不安,科技防疫一躍成為國家利器。但公共衛生與人權隱私的論辯,也再次浮上檯面。
2020 年 4 月,挪威的國家公共衛生機構推出一款接觸追蹤軟體,能監控足跡、提出曾接觸確診者的示警。但兩個月後,這款挪威版的「社交距離 APP」卻遭到挪威個資主管機關(NDPA)宣告禁用!
挪威開發了「Smittestopp」,可透過 GPS 與藍牙定位來追蹤用戶足跡,提出與感染者曾接觸過的示警,定位資訊也會上傳到中央伺服器儲存。然而,挪威資料保護主管機關(NDPA)宣告,程式對個人隱私造成不必要的侵害,政府應停止使用並刪除資料。
為何挪威資料保護機關會做出這個決定?大體來說,仍與歐盟 GDPR 四大原則有關。
首先,NDPA 認為挪威政府沒有善盡公眾溝通責任,目的不清。人民不知道這款 APP 是為了疫調?或者為研究分析而持續蒐集資料?而且,上傳的資料包含非確診者個案,違反了特定目的與資料最小蒐集原則。
此外,即便為了防疫,政府也應該採用更小侵害的手段(如:僅從藍牙確認距離資訊),而不是直接由 GPS 掌控個人定位軌跡,這可能造成國家全面監控個人行蹤的風險。
最後 NDPA 認為,蒐集足跡資料原初是為了即時防疫,但當資料被轉作後續的研究分析,政府應主動說明為什麼資料可以被二次利用?又將如何去識別化,以確保個資安全?
換言之,面對疫情的高度挑戰,挪威個資保護機關仍然認為若沒有足夠的必要性,不應輕易打開潘朵拉的盒子,國家採用「Smittestopp」這款接觸追蹤軟體,有違反比例原則之虞。
「有效的疫情控制,並不代表必然需要在隱私和個資保護上讓步。反而當決策者以防疫之名進行科技監控,一個數位監控國家的誕生,所妥協的將會是成熟公民社會所賴以維繫的公眾信任與共善。」何之行進一步分析:
數位監控所帶來的威脅,並不僅只於表象上對於個人隱私的侵害,更深層的危機在於,掌握「數位足跡」(digital footprint) 後對於特定當事人的描繪與剖析。
當監控者透過長時間、多方面的資訊蒐集,對於個人的「深描與剖繪」(profiling)遠遠超過想像──任何人的移動軌跡、生活習慣、興趣偏好、人脈網絡、政治傾向,都可能全面被掌握!
AI 時代需要新法規與管理者
不論是醫藥研發或疫情防控,數位監控已成為當代社會的新挑戰。參照各國科技防疫的爭論、歐盟 GDPR 規範,何之行認為,除了一套 AI 時代的個資保護規範,實踐層面上歐盟也有值得學習之處。
例如,對隱私風險的脈絡化評估、將隱私預先納入產品或服務的設計理念(privacy by design),「未來照護機器人可能走入家家戶戶,我們卻常忽略機器人 24 小時都在蒐集個資,隱私保護在產品設計的最初階段就要納入考量。」
另外最關鍵的是:設置獨立的個資監管機構,也就是所謂的資料保護官(data protection officer,DPO),專責監控公、私營部門是否遵循法規。直白地說,就是「個資警察局」。何之行比喻,
如果家中遭竊,我們會向警察局報案,但現況是「個資的侵害不知道可以找誰」。財稅資料歸財政部管,健康資料歸衛福部管,界定不清楚的就變成三不管地帶。
綜觀臺灣現狀,她一語點出問題:「我們不是沒有法規,只是現有的法令不完備,也已不合時宜。」
過往許多人擔心,「個資保護」與「科技創新」是兩難悖論,但何之行強調法令規範不是絆腳石。路開好、交通號誌與指引完善,車才可能跑得快。「GDPR 非常嚴格,但它並沒有阻礙科學研究,仍然允許了科學例外條款的空間。」
「資料是新石油」(data is the new oil),臺灣擁有世界數一數二最完整的健康資料,唯有完善明確的法規範才能減少疑慮,找出資料二次利用與科技創新的平衡點,也建立對於資料二次利用的社會信任。
資料來源:https://www.inside.com.tw/article/23814-ai-privacy-medical?fbclid=IwAR0ATcNjDPwTsZ4lkQpYjvys3NcXpDaqsmE_gELBl_UNu4FcAjBlscxMwss
違反學術倫理案例 在 北歐心科學 NordicHearts Facebook 的最讚貼文
我都好俾面,一直無開名,cap圖只是cap你個沒人看到的留言,好客氣,你係都要為意氣之爭包拗頸,我稍稍回應。
我一直講得很清楚,qPCR是不準確的測試,可以有錯,而且在香港有不少出錯案例,不應該「有病假定」。有沒有病也不應是政府說了算,也不應該要強制住院。這是回應政府將qPCR定為金律,並且要人強制入院,是如何違反人權和倫理。
不知道為何有人有意無意誤解成「沒有病徵一定不是病」,然後狂打倒這個稻草人。大佬,鬼唔知cancer都可以無病徵咩,師奶都知啦,我做博士論文乳癌研究添。而「無病徵不一定是無病」,如何推論成「有qPCR結果一定是有病」?
好了,當你贏了,恭喜你拗贏了,打到了這個稻草人了,無病徵也可能是病了,又如何?請問有什麼implications? 即是政府強制你留院是很合理?是不是?
為了贏得意氣之爭,還要誣陷我說「沒病徵即是不需觀察」,我何時何地講過什麼病變都不需檢驗和觀察呢?明明在文章末端,我講明是要定期做抹片檢查,我個人也常建議人做合理的身體檢查。而抹片檢查就是檢查細胞有否異常,非單純看有否病毒DNA。我引用的兩篇論文,是用DNA測試,測出一半女性有HPV DNA,然而我不認為有HPV DNA就是有病。
我引用的學術文章,也提到”most HPV infection do not progress to disease”,那我想問,不是disease也是病?病的英文是什麼呢?在這位人兄眼中,可能那些研究人員也是不合格了。
至於我講及為何qPCR不應是金律,用以拉人入醫院,某人則從沒回應,一味只說「你沒有臨床經驗」。不過我勸你做好心,不懂就不要spin,免得教壞群眾,我認輸啦,你贏了,好嗎?
違反學術倫理案例 在 吳佩蓉 Facebook 的精選貼文
【沒真寫論文再一發】高雄市議員黃香菽碩論涉大量抄襲?!
李眉蓁的碩論涉及抄襲,嚴重違反學術倫理,等同學歷詐騙的惡行,即便明顯違反《學位授予法》,卻僅對外宣稱,「放棄」本不屬於她的碩士學位。而她所屬的政黨要員和民代,選擇力挺到底。李眉蓁的論文指導教授持續神隱,不願說明為何讓這麼瞎的論文從他眼皮下通過;選舉公報刊登不實的學歷,中選會也未對外正式公告刊誤;教育部端出了八項措施後就裝沒事,反正距離立院開議尚早,再過個把個月,已船過水無痕。
李眉蓁沒真寫論文,像她這樣的案例還有多少呢?
在我揭露李雅靜論文涉及濫權及盜用科技部的研究計畫成果時,曾一併提到李的論文口委,竟由學經歷均不適合的前立委侯彩鳳擔任,當時的貼文提及侯的女兒,即現任高雄市議員黃香菽,其碩論〈台灣民意代表服務之評比-以高雄市為例〉與臺北大學黃聖賓的碩論〈地方民意代表進行選民服務內容分析之研究-以第8屆、第9屆臺北市議會為例〉中文摘要部分段落高度相似,而黃香菽在參考文獻並未提到黃聖賓的著作。
經過昨天一整天的人工比對,再次發現苦主不只黃聖賓一人,黃香菽涉及抄襲與不當引用的對象,還包括了維基百科、高雄市議會網站、方翊琴(碩論〈地方民意代表服務品質對選民滿意度影響之研究—以新北市林國春議員服務處為例〉)、黃桂蘭(〈以Facebook 社群行銷探討服務選民的效益與滿意度之分析—以民意代表為例〉) 、張清泉(碩論〈高雄市議員連任因素之研究〉)等。(詳見附圖)
黃香菽是前幾年才畢業,照理論文比對軟體已在校園中普及,為何還出現如此離譜的抄襲?黃香菽的碩論大概只有第四章的「訪談資料分析」像是「自創」,從第一章一路抄到結論,而三位主要苦主黃聖賓、方翊琴、黃桂蘭的著作,均未列入參考文獻。光是人工比對就已找出這麼多抄襲段落,若用軟體查核,應該可以抓出更多。
離譜的是,2018年選舉公報上,黃香菽的學歷除增添一筆碩士外,她還成為該校的講師,真是讓人驚到吃手手啊 !
李眉蓁和黃香菽等幾位民代,已明顯侵犯他人的著作權,違反《學位授予法》的規定,校方和教育部不該坐視。多年來,國家投入了大筆預算建置教育環境,盡可能合理分配教育資源,也努力提供完善的職場或就業機會,希望全國學子能擁有公平競爭的學習環境,也讓多數人憑藉努力和實力來取得晉身的機會。這些弊端和亂象,已侵蝕毀壞這個相對公平的教育制度。
高等教育的各種違建態樣,仍持續搖晃著。大學和教育部就算無法好好把關,也別再把風了!否則,您們真的對不起從小學到高中階段,承受著升學壓力,早出晚歸,補習熬夜,擠入大學和研究所取得文憑的多數國人。
後記
黃香菽出身政治家族,父親是前議長黃啟川,母親是前立委侯彩鳳,堂兄黃柏霖也是市議員,嚴重抄襲的情況不下於李眉蓁。黃香菽自2014年當選,已連任一屆,她在碩論致謝詞寫下「感謝最親愛的家人以及所有服務處的同仁,因為有您們的協助做為我的後盾,讓我可以在假日最多行程的時候,安心地去完成我的學業」。
大學開啟窄門,讓原本必須大學畢業才能攻讀研究所的一般生和在職生,能以同等學力報考或申請,而各校開設的在職專班,更吸引了不少許多想重回校園進修的人,當中也包括政界人士。
受教權理應人人平等,民代或民選首長攻讀碩博士本來也無可厚非,但有些政客先是「善用」了「實質影響力」擠入錄取名單,排擠了其他人的機會,接著在學校和教授的護航下,即便翹課連連,抄襲論文,卻能一路綠燈,順利取得學位,欺世盜名,將假學歷高掛選舉公報來增添選民的好感度。
同樣是在職,這些民選首長和民代和一般在職生待遇其實是大不相同的,參選公職能對外募政治獻金,並獲得選舉補助款,當選後的月薪優於一般上班族,還能聘請助理和得到各種津貼,民選首長和政務官甚至還配有專車、司機。代議政治原是希望選出這些人,專職為大家服務,結果他們把時間和資源拿來充實自己,甚至抄襲論文混張文憑,而選民卻得自食其力,賺錢繳稅養這些人,想進修念書,常得留職停薪或請事假,這些諸多不合理的現況應該要設法改善。
#省力女抄人+1
#教育部
#黃香菽
#李眉蓁
#論文抄襲