中国工业报记者 曹雅丽
当前,在人工智能领域,中美博弈最核心的“主战场”是通用大模型。只有通用大模型能力能够对标国际最先进水平,行业模型才具备持续提升的潜力。
今年全国两会,全国人大代表、科大讯飞董事长刘庆峰全面聚焦“人工智能+”,提出“聚焦自主可控通用大模型,制定国家《通用人工智能发展规划》”“建立国家级数据开放平台”的建议。
刘庆峰
顶层设计:建议制定国家《通用人工智能发展规划》
刘庆峰认为,我国在《新一代人工智能规划》指引下,在认知智能领域已经具备了非常扎实的技术储备和成建制的团队,因此中国有望成为智慧涌现的第二极。
目前,我国通用人工智能的短板还有不少。刘庆峰建议“整合各方资源,发挥举国体制优势,顶格推进,加快制定国家《通用人工智能发展规划》。”
刘庆峰建议,在2017年《新一代人工智能发展规划》的基础上,瞄准我国通用人工智能发展中需要重点补上的短板进行设计,围绕自主可控通用大模型研发、源头技术前瞻布局、算力生态构建、高质量数据开放共享、科学的评测标准制定、人才培养、法律制定和伦理人文等维度,系统性制定国家《通用人工智能发展规划》,顶格推进规划的制定和落地。
他从九个方面系统性阐述该建议:
一是聚焦通用大模型“主战场”,整合各方资源,持续加大投入。他建议以专项的形式从算力、数据、算法上在未来5年内持续支持我国通用大模型的研发攻关,并在资金、行业应用等多维度制定配套政策。
二是围绕通用人工智能相关领域,布局战略性、前瞻性基础研究,坚持以源头核心技术突破来推动颠覆式创新的探索。
刘庆峰表示,力争在大模型能力涌现机理、大模型可信训练推理、强化学习技术、自主学习技术等方面形成突破。他还提出要与量子计算等关键研究的协同攻关,形成交叉学科的突破;重视大模型与科学研究的深度融合,打造AIforScience的科研新范式;在生命科学等多个科研领域引入人工智能通识课,培养一批具备专业科研能力以及高水平通用人工智能理解能力的人才。
三是加快形成以国产大模型为核心的自主可控产业生态。国产大模型向开发者开放,支持大模型对工业互联网、软件行业的赋能,也要支持大模型在汽车、家电等领域的应用,以“人工智能+”推动我国自主可控的大模型产业生态蓬勃发展。
四是推动国家级高质量训练数据开放和共享。加大政府和市场协同,合理解决知识产权问题,构建国家级数据资源汇聚平台,支持国家战略科技力量以揭榜挂帅形式优先、低成本使用。
五是出台更加客观、公正、可信的评测方法,加快大模型在行业领域应用的健康发展。联合国家级权威机构和行业龙头企业等组织,共同发布具有公信力的大模型评测标准和应用指南,并定期组织系统全面的科学评测;在行业应用上,也要加快打造标杆示范,在成效验证后向全国规模化推广。
六是加快推广大模型赋能教育教学,覆盖基础教育、职业教育和高等教育全学段,并以全新机制加快探索我国人工智能拔尖创新人才培养;
七是研究通用人工智能时代人才能力素质模型和培养方案,加快对社会各行业应用型人才的培训;
八是研究通用人工智能技术与应用相关领域法律法规制定;
九是设立软课题,进行通用人工智能相关的伦理人文研究。
发展基石:建议建立国家级数据开放平台
“数据是人工智能发展的基石。当前,我国仍然面临数据资源开放不足、行业数据集质量不高、数据共享机制不健全等制约人工智能发展的问题。”刘庆峰表示。
对此,刘庆峰建议,建立国家级数据开放平台,整合政府、公共机构以及企业的数据资源,为通用人工智能研究和应用提供丰富的数据支持;
“制定公共数据开放计划,有序、安全、合规地开放国家图书馆、档案馆、科研机构等公共机构的数据资源,明确公共数据的开放范围、标准和流程,确保个人隐私安全、数据安全和国家安全。”刘庆峰建议。
刘庆峰建议,鼓励发展和开放行业数据集,建设安全、合规、可信的数据基础设施,加强数据的统筹和利用,助力行业大模型的研发和规模化应用;
此外,建议鼓励企业通过合法途径开放自有数据资源,出台税收优惠、资金支持等激励政策,建立健全企业数据开放的标准和规范,激励企业安全、合规、放心地共享商业数据。
请输入验证码