在2020醫(yī)院信息化集成平臺(tái)建設(shè)網(wǎng)絡(luò)研討會(huì)上,解放軍總醫(yī)院醫(yī)療大數(shù)據(jù)中心主任薛萬國以《智慧醫(yī)院的“數(shù)據(jù)中心”建設(shè)》為主題發(fā)表了演講。以下為整理后的精彩演講內(nèi)容:
2018年,國家衛(wèi)健委出臺(tái)了《全國醫(yī)院信息化建設(shè)標(biāo)準(zhǔn)與規(guī)范》。在標(biāo)準(zhǔn)中,給信息化分為了22個(gè)大類,78個(gè)方面,266項(xiàng)要求。這些要求,覆蓋了醫(yī)院中醫(yī)療、服務(wù)、管理的方方面面。
2019年,國家衛(wèi)健委又提出了智慧醫(yī)院及《智慧服務(wù)分級(jí)評(píng)估標(biāo)準(zhǔn)體系》。明確了智慧醫(yī)院中,包含的智慧醫(yī)療、智慧服務(wù)和智慧管理三個(gè)方面。
其中的智慧體現(xiàn)在三個(gè)方面的特征:泛在、共享、智能。
第一個(gè)方面是泛在,也就是無所不在,形形色色的應(yīng)用。第二個(gè)特征是共享,是在形形色色的應(yīng)用之間,能夠共享數(shù)據(jù),實(shí)現(xiàn)互聯(lián)互通。第三個(gè)特征是智能化,也就是信息化產(chǎn)品的功能要能實(shí)現(xiàn)智能化。
這三個(gè)特點(diǎn)歸結(jié)到一點(diǎn),那就是數(shù)據(jù)的核心作用。
“數(shù)據(jù)中心”為何要打上引號(hào),是因?yàn)樗诓煌瑘龊希哂胁煌暮x和作用。我這里指的“數(shù)據(jù)中心”,不是作為IT基礎(chǔ)設(shè)施的物理“數(shù)據(jù)中心”,而是在醫(yī)院業(yè)務(wù)信息化基礎(chǔ)上,提供數(shù)據(jù)整合與支撐數(shù)據(jù)應(yīng)用的“數(shù)據(jù)”中心。
這樣的數(shù)據(jù)中心,可以匯集各類醫(yī)療業(yè)務(wù)數(shù)據(jù),并提供應(yīng)用支持,但它擁有兩種不同的語境和定位。一個(gè)是面向電子病歷的數(shù)據(jù)中心,有時(shí)候我們稱其為CDR,主要是面向臨床業(yè)務(wù)。另一個(gè)是數(shù)據(jù)分析利用的數(shù)據(jù)中心,這類主要是面向科研和管理為主。
從整體上看,當(dāng)前醫(yī)院信息化建設(shè)活動(dòng)可以劃分為三大塊,分別是業(yè)務(wù)信息系統(tǒng)建設(shè)、集成、數(shù)據(jù)分析利用。在這三大板塊里,數(shù)據(jù)中心位于一個(gè)非常基礎(chǔ)的地位,每一個(gè)板塊都與它有很深的關(guān)聯(lián)。
隨著醫(yī)院需求的不斷變化,如何保持?jǐn)?shù)據(jù)中心的穩(wěn)定,是一個(gè)非常重要的命題。Gartner按照變化節(jié)奏的分層應(yīng)用策略,主要針對(duì)企業(yè)應(yīng)用分為三大層:記錄系統(tǒng)、差異化系統(tǒng)和創(chuàng)新化系統(tǒng)。
其中記錄系統(tǒng)層,主要采用模塊化設(shè)計(jì),實(shí)現(xiàn)核心事務(wù)處理和關(guān)鍵數(shù)據(jù),生命周期通常在10年以上。差異化系統(tǒng),通常采用面向服務(wù)設(shè)計(jì),各個(gè)企業(yè)之間結(jié)合自己的系統(tǒng),有一些針對(duì)性的特色應(yīng)用,生命周期為1-3年。而創(chuàng)新化應(yīng)用采用消費(fèi)級(jí)技術(shù),比如APP等,完全按照新的需求去適應(yīng)應(yīng)用,生命周期較短,通常在12個(gè)月以內(nèi)。
映射到醫(yī)院內(nèi),主要有三類需求變化:
- 便民要求下的服務(wù)形態(tài);
- 政策驅(qū)動(dòng)下的管理變革;
- 新技術(shù)催生的功能形態(tài)。
不變的需求,包含兩方面:
- 病歷記錄的框架與內(nèi)容;
- 診療的基本過程。
由于基本的內(nèi)容不變,醫(yī)院的數(shù)據(jù)中心可以建立不變的需求基礎(chǔ)上,保持穩(wěn)定性。
其主要作用是支撐日常的醫(yī)療業(yè)務(wù)活動(dòng),同時(shí)兼顧一些常規(guī)報(bào)表的管理和應(yīng)用。它的特征是通過系統(tǒng)集成形成,并且以個(gè)體為中心,數(shù)據(jù)要求是實(shí)時(shí)的、長期的、穩(wěn)定的。如長期性,意味著要能夠把患者的歷史上各次就診數(shù)據(jù)都包容進(jìn)來,進(jìn)行長期管理。穩(wěn)定則意味著數(shù)據(jù)中心不能經(jīng)常變,因?yàn)橐坏┳兓厦娴男畔⑾到y(tǒng)也得發(fā)生改變。
醫(yī)院已經(jīng)建立了CDR,是否還有必要面向分析,再建立一個(gè)數(shù)據(jù)中心。主要考慮三點(diǎn),首先面向分析的數(shù)據(jù)中心和CDR的數(shù)據(jù)內(nèi)容存在差異。比如CDR中可能并沒有包含隨訪數(shù)據(jù)或者基因數(shù)據(jù)。第二點(diǎn),是在做數(shù)據(jù)分析時(shí),面向分析的數(shù)據(jù)中心與常規(guī)的統(tǒng)計(jì)工作模式不同。常規(guī)的工作統(tǒng)計(jì)往往是已經(jīng)形成規(guī)范的程序自動(dòng)生成,但數(shù)據(jù)分析往往是個(gè)案隨機(jī)的研究,需要對(duì)數(shù)據(jù)進(jìn)行大規(guī)模的處理。第三點(diǎn)是,兩者采取的技術(shù)形態(tài)不同。CDR可能采用傳統(tǒng)的技術(shù),而在面向分析時(shí)由于數(shù)據(jù)量比較大,操作的數(shù)據(jù)內(nèi)容較多,可能會(huì)采用一些特殊的技術(shù),比如并行處理、分布式處理等。這些原因決定了面向分析數(shù)據(jù)中心的建設(shè)必要性。
面向分析數(shù)據(jù)中心的作用,包括支撐面向臨床的研究、醫(yī)院管理、智能產(chǎn)品開發(fā)的數(shù)據(jù)深度分析挖掘等。其特征是通過ETL形成,以群體為中心,大批量非常規(guī)即席分析,并且數(shù)據(jù)要求的實(shí)時(shí)性不強(qiáng)。
CDR的兩種模式
目前,CDR通常擁有兩種構(gòu)建模式,一種是內(nèi)置模式,一種是外置模式。
內(nèi)置模式,指的是CDR與電子病歷一體化緊耦合設(shè)計(jì),醫(yī)護(hù)工作站可以直接操作CDR數(shù)據(jù),不用經(jīng)過接口。而外置模式中,CDR為第三方廠商提供,通過松耦合的方式與電子病歷集成,其醫(yī)護(hù)工作站通過瀏覽器訪問CDR。
這兩種模式分別有不同的特點(diǎn),內(nèi)置式CDR與電子病歷醫(yī)護(hù)工作站數(shù)據(jù)一體,一致性和實(shí)時(shí)性更好。并且由于其直接操作CDR數(shù)據(jù),所以融合性好,便于數(shù)據(jù)驅(qū)動(dòng)和智能化功能的實(shí)現(xiàn)。比如化驗(yàn)的危急值,馬上就可以觸發(fā)報(bào)警。另外,內(nèi)置式CDR由于擁有較為完善的電子病歷整體設(shè)計(jì),所以老的遺留系統(tǒng)可能不適用。
外掛式CDR與電子病歷工作站數(shù)據(jù)可能存在重疊,比如醫(yī)囑數(shù)據(jù)存在醫(yī)護(hù)工作站里,CDR中也有這些數(shù)據(jù)。所以,這類CDR通常需要進(jìn)行數(shù)據(jù)同步。其次,外掛式CDR需要通過第三方瀏覽器調(diào)閱或者接口調(diào)用CDR數(shù)據(jù),因此融合性欠佳,智能化功能受限。但其好處在于適用于不完備的遺留系統(tǒng)。
總體而言,內(nèi)置式CDR模式是醫(yī)院電子病歷系統(tǒng)的首選,對(duì)于不完備的遺留系統(tǒng),可以通過外掛第三方的CDR方式進(jìn)行彌補(bǔ)。
CDR該如何建設(shè)?
CDR建設(shè),首先是數(shù)據(jù)模型設(shè)計(jì)。是以患者就診活動(dòng)為中心,目標(biāo)是完整覆蓋所有就診記錄,由結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)相結(jié)合。
在建設(shè)過程中,需要注意以下幾點(diǎn)問題:
- CDA標(biāo)準(zhǔn)文檔格式適合交換,但并不適用于OLTP和智能化應(yīng)用。
- 并不一定需要先建CDR才能建集成平臺(tái)。因?yàn)镃DR與集成有關(guān),但集成與集成平臺(tái)之間并沒有必然的關(guān)聯(lián),也可以通過數(shù)據(jù)接口等方式實(shí)現(xiàn)。
- 數(shù)據(jù)的長期管理需要得到重視。因?yàn)橐敫采w患者的整個(gè)生命周期,要把患者歷次的就診記錄(包括門診住院)貫穿在一起,從而實(shí)現(xiàn)長期管理。
- 對(duì)于非結(jié)構(gòu)化記錄,比如心電圖報(bào)告等,在存儲(chǔ)時(shí),要以“人”可讀為基本需求。
CDR如何滿足多元化的數(shù)據(jù)服務(wù)需求?
一類是同構(gòu)型應(yīng)用,比如醫(yī)生工作站和CDR一體化設(shè)計(jì),可以直接訪問數(shù)據(jù)。但是還有大量的第三方應(yīng)用,比如需要解讀化驗(yàn)數(shù)據(jù),要和CDR對(duì)接,可以在CDR的基礎(chǔ)上,在中間層啟用Web Services服務(wù)。通過這種服務(wù),獲得患者的化驗(yàn)項(xiàng)目和生命體征等信息。還有一類異構(gòu)型的應(yīng)用,只是為了看,這種呈現(xiàn)式的數(shù)據(jù)應(yīng)用,通過數(shù)據(jù)瀏覽服務(wù)呈現(xiàn)數(shù)據(jù),如360視圖等。對(duì)于對(duì)外部共享應(yīng)用而言,比如區(qū)域信息化需要用到共享數(shù)據(jù),這種情況可以在CDA的基礎(chǔ)上,內(nèi)部格式提供標(biāo)準(zhǔn)化轉(zhuǎn)化服務(wù),從而把標(biāo)準(zhǔn)化格式共享出去。
智慧醫(yī)院的智慧服務(wù)非常多,且很多是第三方應(yīng)用。應(yīng)用在訪問數(shù)據(jù)時(shí),會(huì)面臨異構(gòu)結(jié)構(gòu),同時(shí)存在數(shù)據(jù)安全問題。這種情況下,CDR可以提供一些標(biāo)準(zhǔn)化的核心服務(wù),以下圖為例,針對(duì)不同的掛號(hào)途徑,提供統(tǒng)一的掛號(hào)服務(wù),不管是APP還是自助掛號(hào),都不用直接操作數(shù)據(jù),而是調(diào)用服務(wù)。同理,醫(yī)囑、繳費(fèi)也可以采用調(diào)用服務(wù)的方式。從而讓外來系統(tǒng)不用直接操作CDR數(shù)據(jù)庫。
數(shù)據(jù)分析中心的數(shù)據(jù)資源架構(gòu)
通常,數(shù)據(jù)分析研究有兩個(gè)路徑,一種是原始數(shù)據(jù)——研究數(shù)據(jù)庫——特征庫,如單病種數(shù)據(jù)庫。另一種是原始數(shù)據(jù)——特征庫。其中,原始數(shù)據(jù)資源庫是整合后的原始數(shù)據(jù),無特定研究目標(biāo)。研究數(shù)據(jù)庫是圍繞研究目標(biāo),預(yù)先構(gòu)建加工數(shù)據(jù)庫。問題特征庫是圍繞具體的研究問題,處理生成可直接分析特征。
那么,原始數(shù)據(jù)是否能一次預(yù)處理到位?
由于自然語言處理等技術(shù)還存在局限性,所以在針對(duì)具體問題研究之前,難以做到一次性“治理”到位。所以,上圖中右邊這條路徑方法要更合適一些。
數(shù)據(jù)中心的技術(shù)選擇
數(shù)據(jù)中心的技術(shù)選擇,需要針對(duì)醫(yī)院數(shù)據(jù)資源與分析特點(diǎn),選擇適宜的技術(shù)。通常醫(yī)院在數(shù)據(jù)整合后,需要進(jìn)行數(shù)據(jù)檢索,即采用列數(shù)據(jù)庫(結(jié)構(gòu)化數(shù)據(jù))和文本分布式索引(病歷文本)。而對(duì)于數(shù)據(jù)處理和分析,通常采用傳統(tǒng)的關(guān)系數(shù)據(jù)庫。
數(shù)據(jù)在數(shù)據(jù)庫中,可以有多種存在形態(tài)和不同的副本,且不用擔(dān)心數(shù)據(jù)一致性問題。數(shù)據(jù)平臺(tái)則是混合式體系,包括多樣化的數(shù)據(jù)管理技術(shù),以及多元化的數(shù)據(jù)處理分析工具,如Sdss、R語言等。因此不存在一體化平臺(tái),Hadoop也并非必選項(xiàng)。
數(shù)據(jù)分析的整體構(gòu)成:
數(shù)據(jù)分析的中心的人才團(tuán)隊(duì)構(gòu)成:
圖片兩大數(shù)據(jù)中心的互動(dòng),可以持續(xù)改進(jìn)數(shù)據(jù)質(zhì)量和數(shù)據(jù)分析質(zhì)量,進(jìn)而提升信息化水平。如圖所示,業(yè)務(wù)數(shù)據(jù)中心抽取原始數(shù)據(jù)后,裝載到數(shù)據(jù)分析中心里, 圍繞特定的問題進(jìn)行分析和建模,可以形成智能化模型,如疾病風(fēng)險(xiǎn)預(yù)測、不良事件預(yù)警等。通過數(shù)據(jù)分析中心,可以發(fā)現(xiàn)數(shù)據(jù)中的質(zhì)量問題,進(jìn)而反饋到業(yè)務(wù)系統(tǒng)中,從而幫助改進(jìn)業(yè)務(wù)系統(tǒng),提高數(shù)據(jù)質(zhì)量。
另外,建立的模型,恰恰是智慧醫(yī)院智慧服務(wù)中所需要的功能基礎(chǔ),在建立模型庫之后,通過提供接口的形式,嵌入到業(yè)務(wù)系統(tǒng)中,進(jìn)而用數(shù)據(jù)分析成果提升醫(yī)院業(yè)務(wù)的智能化水平。兩大數(shù)據(jù)中心,是互動(dòng)和互相完善的過程。來源:醫(yī)有數(shù)