大模型发展已经进入多模态融合阶段,作为人工智能学习、训练和验证的“燃料”基础,大规模、高质量、多模态数据集对于多模态大模型能力提升愈加重要,以数据为中心的人工智能时代正在加速到来。
日前,中国工程院院士刘合在中国石油和化工行业数字化转型发展大会中提出,AI系统的核心是训练的框架加上数据,在实际过程中我们发现,AI系统落地效果的好坏只有20%,这取决于算法,但80%还是取决于数据的质量。从现在来看,参数越来越大,发展的脚步也越来越快。随着模型参数的逐步增加,数据规模也在同步扩大,整个精度越来越高。
刘合认为仍需要探索,因为数据质量的问题,在参数量越大的情况下,面临的挑战是更多的。(徐如玉)
请输入验证码