在數(shù)字化浪潮的推動下,數(shù)據(jù)資產(chǎn)化已成為各行業(yè)發(fā)展的關(guān)鍵驅(qū)動力,健康醫(yī)療領(lǐng)域亦是如此。中文健康醫(yī)療數(shù)據(jù)中蘊(yùn)含著海量極具價(jià)值的信息,但其中敏感信息的保護(hù)卻面臨著嚴(yán)峻挑戰(zhàn)。
神州醫(yī)療秉持“學(xué)以致用,因地制宜”的思想,參照國際上最嚴(yán)格的美國HIPAA法案(Health Insurance Portability and Accountability Act)開展個(gè)人隱私保護(hù)策略及我國適用性研究,解決國際醫(yī)學(xué)信息學(xué)界存在的暴露風(fēng)險(xiǎn)量化的核心技術(shù)挑戰(zhàn)。具體而言,首先開展去識別化策略和在中國電子病歷數(shù)據(jù)中的應(yīng)用情況研究,并進(jìn)一步開展我國人群的敏感信息保護(hù)研究,從技術(shù)上扎根解決風(fēng)險(xiǎn)量化問題,完成了“技術(shù)驗(yàn)證—暴露揭示—策略制定”的全流程敏感信息保護(hù)技術(shù)構(gòu)建,相關(guān)成果已發(fā)表于多個(gè)國際知名期刊。
HIPAA Safe Habor:安全港在中國還安全嗎?
研究成果《Evaluation of Privacy Risks of Patients' Data in China: Case Study》(JMIR Medical Informatics, 2020),通過參照美國HIPAA法案,在中文語境中首次系統(tǒng)評估了HIPAA Safe Habor技術(shù)路線的“去識別-再識別”風(fēng)險(xiǎn)平衡思路,提出針對中國患者數(shù)據(jù)的獨(dú)特性的技術(shù)驗(yàn)證方案,驗(yàn)證了去識別De-identification與再識別Re-identification之間的風(fēng)險(xiǎn)平衡,是中文EMR數(shù)據(jù)個(gè)人識別信息保護(hù)的有效技術(shù)路線,可以達(dá)到國際上公認(rèn)的安全水平。
孕產(chǎn)敏感信息:EMR數(shù)據(jù)利用還有多少河里的石頭需要摸清?
隱私與敏感信息保護(hù)是EMR數(shù)據(jù)使用的先決條件,但中英文環(huán)境具有巨大的差異,無法簡單“拿來主義”,并且國際上也并無孕產(chǎn)敏感信息保護(hù)的先例。對此,神州醫(yī)療發(fā)表了研究成果《Effective Privacy Protection Strategies for Pregnancy and Gestation Information From Electronic Medical Records: Retrospective Study in a National Health Care Data Network in China》(Journal of Medical Internet Research, 2024),這是中國首次全國范圍EMR孕產(chǎn)信息定量分析研究,揭示了中文EMR系統(tǒng)里的敏感信息分布情況,指出電子病歷中孕產(chǎn)信息暴露的主要來源,并且提出了基于風(fēng)險(xiǎn)定量的孕產(chǎn)信息保護(hù)策略EPPGI,風(fēng)險(xiǎn)保護(hù)有效率(Recall)96.8%,處于國際頂尖水平。
性傳播疾?。?/strong>如何制定中文語境下敏感EMR信息保護(hù)策略?
敏感信息泄露可能導(dǎo)致患者巨大的社會壓力,尤其在中國社會氛圍中性文化趨于保守,因此對于任何性傳播疾病的信息泄露,都有可能直接對患者臨床治療產(chǎn)生重要影響。針對此,神州醫(yī)療發(fā)表研究成果《Privacy Protection of Sexually Transmitted Infections Information from Chinese Electronic Medical Records》(Scientific Reports, 2025),對19類性傳播疾病(Sexually Transmitted Infections)患者的敏感信息暴露進(jìn)行風(fēng)險(xiǎn)量化研究,并制定了保護(hù)策略EPSTII對與性傳播感染相關(guān)的關(guān)鍵詞及大量同義詞進(jìn)行發(fā)現(xiàn)和保護(hù),成功率(Recall)達(dá)到99.5%,最大限度地保障了性傳播疾病患者的隱私。
這些研究成果首次在中國開展去識別化后的再識別風(fēng)險(xiǎn)量化研究,驗(yàn)證HIPAA數(shù)據(jù)安全港在我國的適用性,為政策制定者和數(shù)據(jù)管理人員提供決策參考依據(jù);除此之外,研究進(jìn)一步對我國大樣本人群開展隱私暴露風(fēng)險(xiǎn)的量化研究,利用先進(jìn)的自然語言處理及統(tǒng)計(jì)技術(shù),揭示了孕產(chǎn)和性傳播疾病敏感信息的分布模式,并針對性地提出了保護(hù)策略。從考察HIPAA數(shù)據(jù)安全港在中國的適用性,再到基于中國數(shù)據(jù)體系和大規(guī)模人群的自主創(chuàng)新,神州醫(yī)療基于中文電子病歷數(shù)據(jù)自主技術(shù)突破,為國內(nèi)外敏感信息保護(hù)提供了深刻洞察和先進(jìn)技術(shù)賦能!