最近,《华尔街日报》爆料称,谷歌的医疗AI大模型Med-PaLM 2早在今年4月就已经开始在多家诊所进行测试,这引起了业界的广泛关注. Med-PaLM 2是基于谷歌最先进的大语言模型PaLM 2开发的,通过训练大量医疗数据,它已经在医疗问答方面达到了“专家”水平. 这使得谷歌在医疗领域的发展进一步超越了微软等竞争对手.
Med-PaLM 2是谷歌最新的医疗AI大模型,它使用了PaLM 2的3400亿参数和3.6万亿tokens。与其前身Med-PaLM相比,Med-PaLM 2在美国医疗执照考试(USMLE)中的得分提高了19%,达到了86.5分。在一系列临床方面的数据集上,Med-PaLM 2的性能接近或超过了目前的最佳水平.
在超过1000个实际医疗场景的问答测试中,Med-PaLM 2在9项基准测试中有8项表现良好,并且在准确性和稳定性方面与人类医生的回答相一致。实际上,有72.9%的回答被认为与医生的回答相对一致. 这些结果表明Med-PaLM 2在医疗问答方面具有很高的可靠性.
然而,虽然Med-PaLM 2在表现方面已经取得了显著的进展,但它仍然存在一些问题. 例如,在测试中,Med-PaLM 2在"信息准确性/相关性"方面表现不佳,这引发了世卫组织的担忧. 此外,Med-PaLM 2的应用也还处于早期阶段,尚未达到完全可信赖的程度.
除了技术上的挑战,医疗AI的发展还面临着数据隐私的问题。患者的个人隐私是医疗领域应用AI时必须考虑的重要因素. 谷歌作为一家科技巨头,在保护患者隐私方面面临着更大的压力和挑战.
总体而言,Med-PaLM 2作为谷歌在医疗AI领域的最新尝试,展现了强大的潜力和前景. 然而,医疗指标管理系统要使Med-PaLM 2真正成为实际医疗场景中的有力工具,还需要进一步改善其准确性和稳定性,并解决数据隐私等相关问题. 谷歌的努力和创新将推动医疗AI的发展,医疗指标管理系统为医疗行业带来更多的便利和进步。