大数据是什么意思? “大数据”被称为“高容量、高速度和/或高多样性的信息资产,要求具有成本效益的、创新的信息处理形式,从而增强洞察力、决策和过程自动化。”
医学大数据的来源 •管理和索赔数据 •常规人口统计和主要疾病监测数据 •真实世界数据,如电子病历、医学影像、健康检查数据 •研究数据,包括生物标记,以及来自临床试验或队列研究的多组信息 •注册中心(如设备、程序和疾病) •移动医疗设备的数据 •患者报告的数据 要想从大数据中获得最大的价值,就需要新的技术和分析方法(如机器学习),并且必须对所生成的信息进行评估,以进行临床研究,并将其转化为临床实践中使用的工具。
![]()
![]() 中国已经在利用大数据,自2016年以来,许多学术研究项目使用这些国家批准的数据集来评估当前和未来的临床和经济负担的慢性疾病,如心血管疾病、糖尿病、肾脏疾病、慢性阻塞性肺疾病。
在政府的支持下,医学专家建立了基于疾病的数据共享平台,包括心血管疾病、中风、癌症和肾脏疾病。例如,2015年启动的中国肾病网(kidney.net.cn)整合了肾脏疾病的各种数据来源,运用新的分析技术为医疗政策提供证据,加强学术研究,促进有效的疾病管理。
目前在中国应用大数据的项目 政府领导的: •在福建省和江苏省四个城市开展试点项目的区域卫生数据中心 •开放现有的国家行政管理、索赔、死亡登记处和其他学术数据库 •通过支持队列研究和集成数据平台推广精准医疗
研究者发起的 •China Cohort Consortium •中国肾病网 •政府资助的其他项目包括心血管疾病(如中国心血管外科治疗)、中风(如中国国家中风登记处)和癌症(如中国国家癌症登记处)
在医学研究中使用大数据现存的问题 在医学研究中使用大数据的一个问题是尽管中国90%以上的医院都使用电子记录,由于医院不同系统之间的不兼容性,数据的可达性和质量并不理想,采用个人电子健康记录一直是困扰的问题。 在医学研究中使用大数据的另一个问题是缺乏广泛采用的医学术语系统。例如,自2002年以来,国家卫生和计划生育委员会授权所有医院使用国际疾病分类(ICD-9,以及最近的ICD-10)。然而,医院信息系统的发展使得其他临床术语的编码变得更加复杂,使得数据交换变得困难。 通过整合药物的关键术语、分类和编码标准,这促进了更有效的生物医学信息系统和服务,包括电子健康记录。需要更多的努力来解决汉语和英语之间的语言差异,超越现有的术语翻译。 医疗实践模式和中国卫生系统的基础设施也阻碍了大数据的有效利用。 在目前的中国医疗体系中,由于没有统一的国家平台可以整合来自中国所有医疗机构的所有数据,所以几乎不可能通过电子记录系统来追踪病人。进行“深度病人”研究的主要障碍是,使用医学数据,利用机器学习预测未来,从电子记录中获取每个病人的纵向数据和结果。此外,医学实践的广泛差异引起了人们对数据真实性的担忧。 •中国现有的强制性国家行政数据库产生的大数据可以很容易地用于监测重大疾病的趋势,并为医疗保健政策制定提供依据。 •新的数据分析,如机器学习,代替了许多放射学家和解剖病理学家的工作,也可以被使用,并且是中国的一个活跃的研究领域。 •然而,对于需要详细和高质量的临床信息和长期随访的应用,如预测长期结果和为临床决策提供支持,中国的数据系统需要进一步发展。 •在中国,有关大数据的讨论都集中在如何收集、存储、集成和管理数据等。然而,医学大数据的未来在于使用新的分析技术,例如机器来学习回答临床问题,教育医生和决策者了解大数据,并使用大数据技术产生的工具支持临床决策。 Conclusion
•中国促进大数据在健康和医学上的应用很可能在不久的将来改变医学研究、医疗实践和医疗保健行业的发展。我们提倡遵循儒家学说,以确保我们获得真正有医学价值的数据——即,to learn extensively, inquire carefully, think deeply, discriminate clearly, and practise faithfully.
|