科大讯飞刘庆峰：中国需要建立自主可控的通用大模型底座

作者: 曹雅丽来源：中国工业新闻网发表时间：2024-06-28 16:41

分享到：

中国工业报记者曹雅丽

“今天中国大模型的底座能力到底怎么样？在中美科技日益激烈的人工智能领域博弈下，去年10月17日，英伟达因为美国商务部的要求，对中国所有能训练大模型的智能算力全面断供。就在6月25日，OpenAI也正式通知将从7月9日开始终止所有来自中国的API申请。在这个背景下，热热闹闹、风起云涌的通用人工智能浪潮，到底有没有自主可控的国产底座能力做支撑，这决定了我们在这条路上到底能走多远，决定了通用人工智能这一波浪潮；相当于PC和互联网的诞生，在人类历史上有深刻的意义，而我们能不能享受这波红利，能不能成为美国之后全球智慧涌现的第二极？”6月27日，科大讯飞董事长刘庆峰提出疑问。

刘庆峰表示，大模型将会改变信息分发获取的方式，改变人机交互方式，改变内容生产方式，也会改变整个产业形态和竞争格局，改变科研范式，这是大家都能看到的大趋势和未来。Gartner预测，到2026年现在80%的企业都要用到通用人工智能，而今天这个数字是5%左右。

落地各种应用场景

会上，科大讯飞发布讯飞星火大模型V4.0及相关落地应用。刘庆峰表示，升级发布的讯飞星火不仅在底座能力上全面对标GPT-4Turbo，还落地各种应用场景服务每个人和每个企业。

此次讯飞星火APP/Desk全新升级，发布“个人空间”，打造更懂你的AI助手；面向专业领域的个性化应用，科大讯飞升级讯飞晓医APP，上线个人数字健康空间，打造每个人的健康助手；业界首发星火智能批阅机，“AI助教”助力老师减负增效、因材施教；讯飞AI学习机升级1对1答疑辅导功能，打造每个孩子的AI学习助手。

此外，面向万物互联时代，星火语音大模型再突破，发布74个语种/方言免切换对话，破解强干扰场景下语音识别难题，发布国际领先的极复杂场景语音转写技术，并通过云边端及软硬一体化解决方案，赋能汽车、家电、机器人等领域人机交互变革。此外，面向企业“人工智能+”场景价值落地最后一公里，科大讯飞正式发布星火企业智能体平台，并推出星火商机助手、星火评标助手等典型智能体案例，助力企业价值创造。

“每一次人类文明进步的背后都有一个了不起的助手，每一代助手都有它的使命。”刘庆峰说，讯飞星火的使命是解放生产力、释放想象力，“希望通过我们的能力，成就每一个了不起的企业，帮助每一个人都成为了不起的自己。”

据介绍，讯飞星火V4.0在图文识别能力上进一步升级，在科研、金融、医疗、司法、办公等场景的应用效果已领先GPT-4o。此外，星火长文本能力也全新升级，并针对长文档知识问答的幻觉问题，业界首发溯源功能。

外部权威测试集也体现出讯飞星火V4.0的领先性。在国内外12项大模型主流测试集中，讯飞星火在8个测试集中排名第一，超越GPT-4Turbo等国际大模型，国内大模型全面领先。

如何打造懂你的AI助手？刘庆峰提出，AI助手要能够基于用户画像进行个性化表达，基于使用历史进行记忆学习，基于个人资料进行增强学习。在构建用户个人画像时，人设风格可以自己选定，也可以根据对话和使用历史动态完善，进而形成个性化的表达风格；AI助手再结合个人资料，就可以生成个性化和针对性内容。

基于此，讯飞星火APP及桌面版全新升级改版，率先发布“个人空间”，用户可以上传自己的工作、学习、生活、健康等各类资料，形成每个人的专属知识库，再结合人设，让大模型生成更个性化内容。此外，讯飞星火首批上线14个智能体，面向特定场景打造专属助手。

刘庆峰表示，星火大模型还打通了全系讯飞C端软硬件产品生态，数百万智能硬件用户一键拥有“星火全家桶”。比如讯飞智能办公本、智能录音笔的文件可以一键同步到星火个人空间中，通过数据互通、操作联动，把一篇办公本里会议记录同步到星火中，就可以让星火进行公文写作，还可以做PPT，以及生成待办事项等，带来更高效的办公体验。

面向专业领域的个性化应用，科大讯飞升级讯飞晓医APP。此次讯飞星火医疗大模型再次升级，医疗核心能力全面超过GPT-4Turbo。在此基础上，讯飞晓医APP各项能力持续升级，覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验，满足用户在看病前、用药时、检查后的核心场景健康需求。

此外，得益于底座大模型的升级和面向教育复杂场景的图文识别效果进一步提升，科大讯飞发布首款星火智能批阅机，它集智能批改、学情分析、个性作业于一体，它支持自由排版，不限纸张大小的作业，在支持多学科多题型智能批改的同时，还能即时生成多维学情报告，还为老师作业讲评和面批辅导提供了素材。

星火语音大模型迎来新突破

记者了解到，近期科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化》项目，获得国家科学技术进步奖一等奖。发布会现场国奖得主再出“王炸”，星火语音大模型迎来新突破。

刘庆峰认为，语音将成为万物互联时代人机交互的主要方式，人机交互最重要的场景是远场、噪声、多人说话、多语言，因此万物互联时代的AIUI（人工智能用户界面）要满足远场高噪声、多语言多方言、全双工、多模态等标准。科大讯飞也主导制定了全双工语音交互ISO/IEC国际标准，并于2023年5月发布。

面向万物互联时代，本次星火语音大模型发布国际领先的多语种多方言免切换语音识别能力，可支持37个语种、37种方言“自由对话”。其中，37个语种识别效果领先OpenAIwhisper-V3，37个方言识别效果平均提升30%。现场，科大讯飞演示了讯飞输入法混合方言和外语的语音输入效果，能让输入效率大大提高。

会上，科大讯飞还发布了软硬件一体化讯飞同传系统，可支持大会同传、会议同传、展厅同传、旅游同传等多场景使用。

针对强干扰场景下的语音识别难题，科大讯飞突破了多人混叠场景下的极复杂场景语音转写，即使在三人混叠说话场景也能实现86%的语音识别准确率。未来基于多模态的声音识别技术，将应用在讯飞听见智慧办公、智慧屏等办公产品中。

刘庆峰指出，大模型正在推动人机交互变革，语音领域的所有应用都值得被重构。在大模型加持下，星火汽车智能座舱全新升级，不但具备了多语种多方言的“自由交互”，还具备多情感多模态的超拟人交互，让人车交互更有温度。

“当前，讯飞语音交互产品国内市占率稳居第一，同时广泛出口到世界各地。星火大模型为一汽、奇瑞、广汽、江淮、长城等车企的众多车型，赋予了高度智能的交互体验。”刘庆峰介绍说。

为了让大模型更好落地，科大讯飞还打造了云边端一体化和软硬件一体化的解决方案，赋能家电、运营商、机器人等更多行业场景。面向具身智能和人形机器人企业需求，本次科大讯飞正式发布机器人超脑平台2.0，业内首个支持多模态交互。目前，400+机器人企业已经采用讯飞机器人超脑平台。

星火企业智能体平台正式发布

自去年5月6日发布以来，讯飞星火大模型正成为国家能源集团、中国石油、中国移动、中国人保、太平洋保险、交通银行、奇瑞汽车、中国一汽、大众汽车、江汽集团、海尔集团等多领域头部企业的首选。

据了解，讯飞星火已经在代码、合规审查、客服、评标、智能交互等多个典型场景产生应用成效，以交通银行为例，基于星火大模型能力的产品iFlyCode覆盖6000+研发人员，代码采纳率达38%，工作效率显著提升。

如何更好地解决企业大模型应用的最后一公里问题？刘庆峰谈到，企业首先要科学地认识大模型能力的边界，根据任务难度选择合适方案，并且用更少的算力、更高的效率，打造企业专属大模型。随着星火V4.0的发布，他认为用智能体平台打造每个岗位的专属助手的时间已经到了。

现场星火企业智能体平台正式发布。围绕搭建智能体的三大关键能力，当前企业智能体平台已覆盖400+AI原子能力，集成90+外部信源，打通100+内部IT系统，可供企业结合业务场景快速构建可落地的智能体应用。平台还围绕生产域、科创域、办公域、管理域上线32个企业智能体，供企业即插即用。

基于企业智能体平台，科大讯飞打造了星火商机助手、星火评标助手等典型应用案例，为企业应用打样。

讯飞星火大模型带来行业赋能的同时，也在助力开发者生态蓬勃发展。

自今年1月30日讯飞星火V3.5发布以来，短短5个月，星火开发者生态加速增长，开发者数从598万增长到702万，新增超104万；海外开发者数超40万；大模型开发者达57万。越来越多开发者正加入星火生态，释放更多刚需场景的应用价值。

刘庆峰说，只有自主可控的繁荣生态，才有中国通用人工智能的大未来。面向未来的人工智能新生态，他强调要关注源头技术生态、智能体生态、应用生态和行业生态，实现自主可控和软硬一体，才能实现大模型的深度落地；既要科学理性地认识中美在大模型上的综合差距，也要有信心快速追赶，给出从源头技术、到产业生态、再到应用落地的一整套的打法，以长期主义来打造真正自主可控的AI产业生态。

作者：曹雅丽

编辑：袁海霞

分享到：

评论一下

科大讯飞刘庆峰：中国需要建立自主可控的通用大模型底座

请输入验证码 ×

请输入验证码