摘要:由于沒有完整可用的指標(biāo)同義詞庫以進(jìn)行指標(biāo)映射,各家醫(yī)院關(guān)于同一檢驗(yàn)檢查指標(biāo)的不同稱謂,已嚴(yán)重影響到了區(qū)域間醫(yī)療信息的互聯(lián)共享,因而需要對檢驗(yàn)檢查指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理.這可以看作是一個實(shí)體對齊問題,但指標(biāo)只有相應(yīng)的取值和取值范圍,難以像知識庫實(shí)例匹配那般使用到屬性信息,也不似實(shí)體鏈接那般擁有上下文信息,而且不存在一個標(biāo)準(zhǔn)知識庫來提供所有指標(biāo)的標(biāo)準(zhǔn)名稱.針對以上問題,提出指標(biāo)標(biāo)準(zhǔn)化算法,先根據(jù)指標(biāo)字面特征進(jìn)行聚類,再使用相似度特征和分塊打分特征迭代地進(jìn)行二分類映射.實(shí)驗(yàn)表明,最終的二分類映射,其 F 1-score可以達(dá)到85.27%,證明了該方法的有效性.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社