雷竞技-建立百万级医学代码字典库,康鼎科技如何实现海量医疗数据标准化?
作者:肥仔 时间:2023-10-02

   成立百万级医学代码字典库,康鼎科技若何实现海量医疗数据尺度化?

国内医疗年夜数据行业,正在从“概念盈利期”慢慢过渡至“价值兑现期”?

作者: 王鑫雪来历: 动脉网2022-08-03 14:07:22

国内医疗年夜数据行业,正在从“概念盈利期”慢慢过渡至“价值兑现期”?

从外部政策情况来看,自2015年《国务院关在印发增进年夜数据成长步履纲领的通知》初次明白指动身展医疗健康办事年夜数据、扶植医疗健康治理和办事年夜数据利用系统后至今,国度已接踵出台多份文件鞭策医疗年夜数据行业成长,并慢慢从“肯定扶植”注意到“若何扶植”“若何监管”等细分层面。

政策的鼎力鞭策催生出多量企业、投资机构入局,也带来了一级市场投融资的火热。

据动脉橙2022年Q1全球健康医疗年夜数据价值趋向陈述显示,2018年国内健康医疗年夜数据企业迎来融资井喷期,随后,跟着国内医疗人工智能成长步入深水区,医疗健康年夜数据行业融资也逐步趋在沉着,但在2020年、2021年慢慢回升,达到颠峰。

而颠末多年沉淀,一批耕作在细分范畴的企业也走到了D轮和今后轮次,慢慢进入收成期。但从2016年-2021年融资数据来看,仍有55%的被投企业处在A轮和之前轮次,意味着在医疗年夜数据这一范畴仍存年夜量草创公司,也意味着离行业整体迈入收成期还存在必然距离。

与此同时,医疗年夜数据行业依然面对数据孤岛、数据尺度化、隐私平安等问题,问题背后的解决方案成了企业成长的要害密钥——谁能率先冲破,谁便能凸起重围。

你追我赶之间,有的企业选择投身在病院信息化基建扶植,有的企业选择为病院搭建数据集成平台,也有的企业选择为病院、保险公司、药企等搭建数据桥梁,发掘医疗数据的利用价值。

康鼎科技属在最后一类企业。不成否定的是,它的竞争敌手良多,但历经7年的行业摸爬滚打以后,这家企业也找到了本身安居乐业的地点。

一次与五十余家中西病院医疗数据的偶尔“相遇”

假如要为中国医疗行业写一本纪年史,2015年必然“浓墨重彩”。

或许直到此刻,还药企和CRO公司记得2015年7月22日此日。在此日,CFDA投下重磅“炸弹”——《关在展开药物临床实验数据自查核对工作的通知布告(2015年第117号)》,强挪用最严谨的尺度、最严酷的监管、最峻厉的惩罚和最严厉的问责对已审批和期待审批的注册申请展开临床实验数据自查核对工作。

就当从业者都认为这是一份“情势”严酷的新规时,强硬的履行力度很快让这一设法云消雾散,撤回品种也从第一个月的20%酿成了一年内的89.4%。

行业阵痛的背后,反应出了国度解决临床项目数据造假、不规范、不完全的决心,为医药行业后续有序成长营建了杰出的政策情况,也在全部行业数据规范意识醒觉的同时孕育出了一个庞大的蓝海市场。

恰是在如许的布景之下,康鼎科技的开创人选择了入局,并在2016年介入到了“国度十三五新药重点研发打算”的项目当中,介入了全国50余家中、西三甲病院的医疗全数据深度发掘。

据康鼎科技总司理薛韶波回想,初度接触如斯年夜体量的医疗数据,团队都十分兴奋。兴奋以后,重大的工作量也让每小我都感触感染到了这份工作的艰辛:在近三个月的时候里,团队成员几近天天都吃睡在公司。

坚苦重重,最使人头疼的倒是看似最“不起眼”却最要害的尺度化工作,缘由在在这项工作在那时只能经过人工进行操作。

“我们那时只有187小我,面临这么年夜体量的数据,只强人工在表格中逐一尺度化,就是干到退休也干不完啊。”薛韶波感伤到。

也恰是这段履历,让康鼎科技萌发出了将数据尺度化工作主动化、智雷竞技能化的设法。

一个统筹中西医范畴的百万级医学代码字典库

医疗健康数据对科研、药物评价、患者治理等方面意义重年夜。这是行业不争的事实。

但不管是在何种范畴的利用,都没法直接经由过程狼藉无章的医疗数据进行转化。换言之,所有关在医疗健康数据的利用,都必需成立在尺度化这一根本之上。

而尺度化的第一步,即是同一名称与指标。以白细胞为例,其在临床查验项目中可被称为白细胞、WBC等。是以,数据尺度化的第一步即是将各项目名称尺度化,然后再进行指标的尺度化(数据指标的单元分歧、正常值规模分歧,需要用科学的算法进行同一),终究构成的数据才具有数字资产的发掘与利用价值。

可是,遗憾的是,行业今朝并没有现成“尺度”可循。是以,颠末多年尽力,康鼎科技“自创”了一套统筹中西医范畴、包括ICD-10和WHO的医学代码字典库。

据薛韶波流露,这一字典库的构成并不是是康鼎科技拍着脑门梦想出来的,而是履历了100余场的专家论证会议的成果沉淀,具有社会公认性和市场利用性。

“从某种水平上来看,字典库同等在数据匹配的尺度,只有具有了尺度,才能强势占据市场。”薛韶波暗示。

但字典库只是一套参考系统,要想真正面向市场、占据市场,还需要一套与之相匹配的操作系统。

对此,康鼎科技也在前述字典库的根本上构成了一个数据尺度化平台。具体操作流程为数据录入——数据清洗——标化人员批量标化部门不规范辞汇——质控人员二次审核。

而且,康鼎科技数据尺度化平台可以或许实现数据的主动化匹配,即数据与字典表之间类似度的匹配,这也是该平台实现数据尺度化的根本。

具体而言,在尺度化进程中,如辞汇规范,与字典表的类似度为100%,则该辞汇可以或许实现主动匹配;如辞汇与字典包的类似度不敷,则由标化人员或质控人员实行二次标化;如类似度为0且字典表中暂无匹配字段时审核人员可以进行重置。

而不管是数据的初度尺度化仍是标化人员与质控人员的二次尺度化,该平台都能撑持批量化操作。固然从理论上而言,该系同一次性操作的数据量并没有上限(数据处置量首要与办事器机能相干),但康鼎科技建议将单次批量标化数据条数设置为50条。

也恰是在主动化、批量化的根本上,康鼎科技的数据尺度化平台与传统人工操作比拟,更高效,更具性价比。

“在字典库和尺度化系统成立之前,数据尺度化工作是在excel表中展开,一个工作人员8小时标化数据的效力小在等在500条,每条信息的尺度化本钱为8元,本钱高且效力低。”薛韶波流露道,而在划一时候内,康鼎科技的数据尺度化系统的工作效力可以到达150000条以上,为人工操作的300倍,且经审核人员检验,数据精准度为90%以上。

可是,不管是字典库仍是数据尺度化平台,都还只逗留在手艺层面,若何真正落地,为医疗健康行业带来真实的价值,实现真实的价值转化,是企业该当思虑的另外一个要害问题。康鼎科技又选择了如何的路径?

医学代码字典库国内医疗年夜数据行业医疗健康治理和办事年夜数据利用系统

存眷年夜健康Pai官方微信:djkpai我们将按期推送医健科技财产最新资讯

最新快讯医疗人工智能 | 微脉发布国内首款健康治理范畴年夜模子利用CareGPT

3天前

上一篇:雷竞技-刘翔峰事件余波未了:一个“坏医生”会带崩整个“湘雅系”吗? 下一篇:雷竞技-中疾控:奥密克戎不大可能是最后的变异株
友情链接
hth华体育app官网登录/华体会最新首页登录 亚新体育(中国)官方网站 江南.体育(中国)官方APP下载 半岛APP.(中国)官方网站 亚新体育.(中国)官方网站-ios/安卓通用版/手机版 爱游戏app官方最新版|爱游戏官网网页版 江南体育(中国)官方网站-ios/安卓版app下载
联系我们

咨询热线:4008004488

全国热线:4001600998

官方邮箱:believen@

商务网站:www.yyjzt.com

公司地址:中国湖北省武汉市汉阳区龙阳大道特8号