中国青年报客户端合肥1月30日电(中青报·中青网记者 王海涵 王磊)1月30日,科大讯飞发布会上,科大讯飞董事长刘庆峰、研究院院长刘聪正式发布讯飞星火认知大模型V3.5,在语言理解、文本生成、知识问答、逻辑推理、数学能力、代码能力和多模态能力七个方面实现升级。会上,首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B正式发布,在处理复杂的自然语言任务时更加得心应手,展示了国产算力的能力。
发布演示现场。科大讯飞供图
讯飞星火自去年5月诞生以来,不断迭代升级大模型能力,深耕教育、工业、汽车、保险、科研等行业应用刚需。去年10月24日,科大讯飞携手华为启用首个支撑万亿参数大模型训练的国产算力平台“飞星一号”。启用后的90多天里,“飞星一号”开始了对标GPT-4的更大参数规模的大模型训练,最终实现星火V3.5的语言理解和数学能力超过GPT-4 Turbo模型。
“在更好的数据、更强的人机协同训练中,我们不能只看单个的‘原子’能力,而是要以技术进步来解决真实世界的刚需。”刘庆峰说,让机器具备学习、推理和决策的能力,就是认知大模型的主要工作。而大模型发展,应用才是硬道理,企业要将大模型技术的创造力转化为促进产业高质量发展的新质生产力。
展望2024年,刘庆峰指出三点:“第一,要清醒理智看到差距,在通用大模型的底层能力上持续对标国际最先进水平,在算法研究上做出相对更优效果;真正让大模型量质齐飞,不仅是行业应用,还要在很多关键技术创新上联动大模型;高楼大厦要建立在安全可控的平台之上,要实现自主可控平台上的生态繁荣。”