中国青年网北京9月23日电(记者 杨月 闫章默 实习生 郭劭佳 范珂萌 刘傲)“中国开源模型在Hugging Face上下载量超过美国模型,未来开源模型的发展将呈现什么样的面貌?”“在人工智能尤其是大模型技术快速发展的今天,我们如何构建一个既能保障技术普惠,又能维护人文温度的未来生态?”……9月22日上午,2025北京文化论坛专业沙龙“文化智能新业态:产业赋能与创新路径”在阿里巴巴北京总部举办。本次活动由北京市委网信办承办,朝阳区委宣传部、朝阳区委网信办、阿里巴巴集团、朝阳区互联网行业党委及互联网协会执行,旨在深入探讨人工智能开源技术文化与文化产业创新的融合发展路径,为“文化和科技融合发展”年度主题提供实践案例与创新思路。
“在开源大模型方面,中国已经走在世界第一梯队”
“在开源大模型方面,中国已经走在世界第一梯队。”CCF开源发展委员会副主任章文嵩说。中国开源运动起步于上世纪90年代末,最初以应用国外开源技术为主。随着互联网产业的蓬勃发展,阿里巴巴、百度、腾讯等企业逐渐从开源使用者转变为贡献者。

沙龙现场。主办方供图
全球开源技术演进与中国开源发展呈现出两条交织的轨迹。国际层面,从Linux到OpenStack,再到Hadoop、Spark等大数据框架,开源已成为技术创新的主流模式。而中国方面,随着移动互联网的迅猛发展,中国开发者群体迅速壮大,目前已成为全球第二大开源贡献国。
“中国开发者的数量非常庞大,远远超过美国。”章文嵩指出,这种规模优势为开源生态的繁荣提供了土壤。“我们在生态应用、方法,甚至前期的训练过程都有很大的空间,能让中国的公司崭露头角引领世界。从应用需求场景来看,未来中国在很多领域都可以引领世界。”
近年来,随着大模型技术的突破,中美在AI开源领域呈现出不同的发展路径。美国公司如OpenAI、Google等倾向于保持核心模型的闭源,而中国企业则采取了更加开放的策略。
通义千问、DeepSeek等国产大模型的全面开源,使中国在AI开源实践上形成了独特优势。数据显示,通义千问系列在HuggingFace上的下载量持续位居前列,成为全球最受欢迎的开源模型之一。DeepSeek、月之暗面等国产大模型的开源引发了OpenAI等企业的战略调整。“我们整个发展是一种百花齐放的发展。”清华大学长聘副教授陈渝说道。
“期待大模型训练数据的维基百科有出现的一天”
“下一步,希望拿出开源训练数据集,里面的许可证应该是全员的,这是人类的通用知识,确保这一块领地大家可以开源共建的。但是并不影响这个智能化,因为各行各业都有很多私有的数据,在通用的知识引擎上再加上微调私有的数据,还是形成个人或者企业私有化的数据,这并不矛盾。”章文嵩说。
当前的开源大模型通常只公开模型权重,而训练数据、训练方法和过程仍被视为商业机密。
这种“黑箱”模式不仅限制了技术的透明性,也带来了数据质量、版权合规等一系列问题。
工信部电子标准院软件中心开源研究室主任杨丽蕴指出,当前AI模型开源协议尚未统一,缺乏针对大模型的标准化许可框架。“现有许可协议主要面向软件领域,但模型开源不只是代码问题。”
事实上,治理问题一直是人工智能发展的核心点之一。杨丽蕴说道:“许可协议和AI BOM的建设发展都非常重要。”
数据版权风险已成为行业发展的隐忧。阿里云基础软件部负责人马涛提到美国Anthropic公司与作家联盟的和解案例:“数据的合法性、质量与伦理对齐,是AI开源能否持续的关键。”
小米基础技术平台部负责人张铎则从隐私保护角度呼吁立法跟进:“至少应该弹一个通知,询问用户是否允许数据被用于训练。”他认为,健康等敏感数据必须脱敏后才能使用,否则将带来巨大风险。
在数据开源路径上,章文嵩提出了“通用知识属于全人类”的观点。他说:“大模型确实带来这一轮智能化的革命,能够把人类的知识、很多的知识压缩到网络上。原有数据的准确性质量是至关重要的,虽然现在有很多开源的大模型,开源的大模型大部分都是训练完成之后,那些参数的权重开源出来,之前训练的数据集,包括训练的过程都没有开源,所以怎么确保开源大模型本身的安全是非常重要的话题。”他建议构建一个类似维基百科的大模型训练数据集,由人类共建共享。
“这不仅能确保知识的普惠性,也能促进小语种等稀缺资源的发展。”他提到,因为大部分训练的语料都是中文和英文,很多小语种没有,东南亚的比如马来语,通过开源的方式一套大模型训练的方法论相应的工具开放出来,马来西亚小语种这些也可以整理出相应的语料,这些语料可以更加丰富。
“科技不应冰冷,而应成为人文关怀的载体”
如何让AI应用走进更多人的生活,提升效率并重塑创作与传播流程?沙龙下半场,多位来自文化实践一线的专家分享了AI如何重塑文化创作与传播的生态。

沙龙现场。主办方供图
阿里云设计部总经理、北京冬奥会火炬设计师李剑叶分享了与巴黎奥组委的合作案例。通过通义大模型修复历史影像资料,让历史上的伟大女性运动员形象重新鲜活起来。“AI技术让文化设计从‘人手创作’走向‘人机共创’。”
清华大学美术学院教授蒋红斌则从教育视角指出,AI不是替代艺术家,而是帮助突破思维局限。“人工智能时代,我们要培养的是具有文明向度的创造者,而非技术工具人。”
AI正在成为文化普惠的重要推动力。虎鲸文娱公益负责人、无障碍剧场负责人陈艳玲展示了AI在无障碍文化服务中的应用。通过语音合成与字幕生成技术,视障观众可拥有“专属解说电影”,听障群体也能享受“字幕助听版”影像内容。“我最早是电影解说人的志愿者,当时讲一部电影要看八九遍才能理解这个电影的意思,把我理解的传递给视障朋友,而现在我们一天可以做很多部无障碍影片,这就是实实在在在我身边的变化。”
“科技不应冰冷,而应成为人文关怀的载体。”陈艳玲表示,AI不仅提升了文化服务的效率,更拓展了文化的包容性。她还介绍,“在2022年优酷推出了数字人厘里,她代言了很多品牌,还参演了电影,还是电影《异人之下》中二状的扮演者,她的优势在于她永远也不会老,也不会塌房,还有一个很关键的原因,加入数字人相当节省成本和时间,制作成本能降低80%。”
在内容创作层面,像素绽放PixelBloom副总裁张祺分享了AI如何重塑生产链路。其产品AiPPT在全球获超2000万用户,成为文化内容高效创作的典型代表。“在1厘米的宽度上做100米深度的产品,是AI时代创业者的机会。”
清博元宇宙研究室主任柳春阳则认为,AI让内容创作实现“平权”。“好的内容创作不再局限于专业机构,个人也能借助AI实现创意表达。”
“人工智能挑战知识产权管理,需建立新规则体系”
随着AI深度参与文化创作,一系列新的挑战也随之浮现。创作主体性的模糊、版权归属的界定、文化多样性的维护等问题,都需要新的治理框架。
李剑叶认为,AI擅长“规则的熟练掌握”,但真正的创造力源于“对规则的破坏与重构”。他举例称,其团队为顶刊设计的封面之所以被采纳,正是因为设计师提出了“寻找长得像0和1的病毒”这一AI难以自发生成的创意。
在版权归属方面,柳春阳提出了创新性的解决方案。他建议将AI作为第一作者,人作为第二作者,并通过区块链存证、创作过程记录等方式明确各方贡献。“如果AI生成了绝大部分内容,那么版权归属应当反映这一事实。”
蒋红斌则从更宏观的视角指出,AI是“人类共同的科技产物”,未来的制度设计应超越现有版权框架。“人工智能在知识产权管理上对整体的人类是一次挑战,需要建立新的规则体系。”
在技术伦理层面,多位专家强调了对齐安全的重要性。张铎指出,需要在模型能力与安全性之间找到平衡。“对最终提供服务的产品要有严格监管,但对开源模型本身不宜限制过严,否则会影响模型创造力。”
“真正让中国在很多领域大有作为,并引领全世界”
正如阿里研究院院长袁媛所言:“科技是人类的左脑,文化是右脑。只有二者协同,才能推动社会向更善治、更温暖的方向发展。”
本次沙龙探讨了AI时代技术开源与文化融合的路径图。在技术层面,中国正从开源追随者向引领者转变,通过更加开放的策略推动AI普惠;在文化层面,AI正从辅助工具升级为创作伙伴,重塑文化生产与传播方式。
全球视野下,中国探索的“技术普惠+文化融合”双轮发展路径,为人工智能时代提供了一种可供借鉴的发展范式。这种模式既强调技术创新的开放共享,又注重文化传承的人文温度,在效率与公平、创新与传承之间寻找平衡点。
正如章文嵩所展望的,中国在手机、消费电子等多屏互动领域具有市场优势,有望形成更多开放标准与开源实现,“真正让中国在很多领域大有作为,并引领全世界。”