全国政协常委钱锋:多份提案聚焦人工智能赋能新质生产力 大模型研发低水平重复,需足够算力突破算法瓶颈

发稿时间:2024-03-07 12:55:00 来源:中国青年报客户端

  中国青年报客户端讯(中青报·中青网记者 王烨捷)正在召开的全国两会上,新质生产力成为代表委员们关心的重点。全国政协常委、中国工程院院士、国家流程制造智能调控技术创新中心首席科学家钱锋提交了多份聚焦人工智能助力新质生产力发展的提案。

  “人工智能是助力我国制造业高质量发展的‘加速器’。但我国目前在核心技术、产业赋能、数据算力、人才队伍等方面还存在短板。”在《关于让人工智能为新型工业化注入新动力的提案》中,钱锋指出,目前我国工业智能关键核心技术亟待突破,我们更多关注人工智能的应用,但针对特定科学和工程问题的算法创新与世界领先水平差距较大。高端工业软件90%以上依赖进口,被人“卡脖子”风险大。

  他介绍,我国人工智能在工业领域的应用仍以单个环节、单个企业为主,能够有效运用数字技术全生命周期、全产业链提高生产效率、降低成本消耗、提升产品质量、减少环境污染的企业还不多,亟需以人工智能为代表的新一代信息技术打通工业生产全过程。

  此外,我国数据开放共享机制不完善,缺少训练大模型的高质量工业数据语料库。各地、各高校院所纷纷建立智算中心,造成算力资源分散的情况。不仅如此,国内能将模型、算法与应用场景匹配的人才稀缺。我国高校学科设置交叉融合程度不高,人培养无法匹配行业需求。

全国政协常委钱锋。受访者供图

  为此,他建议强化工业智能核心技术自主创新,打造人工智能物理建模、高性能计算等研发工具,构建自主可控的工业智能软硬件应用和生态。

  钱锋认为,我国当前应布局“人工智能赋能新型工业化”等科技创新专项,加大对人工智能通用和垂直大模型支持力度。鼓励行业龙头企业开放应用场景,打造高质量工业语料库,构建垂直行业人工智能训练验证平台。打造重点领域人工智能开源平台,降低大模型训练成本。

  他指出要推动科研和产业数据共享,依托隐私计算、区块链、联邦学习等技术,构建安全可信的共享平台。引导行业用户开放核心业务场景,对政府投入的场景数据“应采尽采”。构建国家人工智能公共算力平台,鼓励有条件的单位贡献剩余算力,探索多元异构、多卡并行的算力统筹规划机制,攻关大规模并行训练等前沿领域,打造超大规模算力集群。

  在《关于加快我国人工智能大模型发展的提案》中,钱锋指出,目前国内大模型研发的内容大多为低水平重复,缺少创新性强、具有革命性的基础理论研究。开源往往仅涉及参数,代码或数据并不完全提供,数据采集和清洗、技术的探索研究、场景应用等趋于同质化,难以形成合力。

  钱锋指出,科研人员需要算力来解决人工智能基础问题,如大模型背后的涌现机理、生成算法中的数学问题等,“如没有足够的算力资源,将导致科研人员无法突破算法瓶颈,长此以往会对我国人工智能的持续创新产生较大影响”。

  他建议,一是以创新联合体的方式促进人工智能基础理论和创新算法突破。这种联合体,由企业和高校共建,企业和政府共同投入数据和算力资源;二是建设具有国际竞争力的人工智能新型研发机构,征召一批人工智能顶尖算法和工程人才投入大模型研发竞争赛道,该机构提供数据、技术和算力等,并与合作企业联合获得大模型市场收益;三是建立国家算力共享平台,鼓励有条件的单位贡献剩余算力;四是发布权威大模型评测结果,制定关键领域标准规范。

责任编辑:白珂嘉