为了更好的体验,请使用竖屏浏览

2023年科创年度关键词:AI大模型迭代加速,技术门槛等困境待解

“百模大战”鏖战正酣 广东制度引领技术创新卡位大模型

来源:南方都市报 作者:陈培均 彭乐怡 徐劲聪 01-26 02:14

  广东省人工智能产业协会常务副会长兼秘书长张崟。受访者供图

  制图来自腾讯混元大模型

  2023年是大模型飞速发展的一年。对于或将重塑行业生态的AI大模型,由众科技巨头打响的“百模大战”鏖战正酣。据不完全统计,截至2023年8月,中国已发布各类大模型数量上百个,模型参数规模大于百亿级别的大模型产品达15个。

  同时,各大省市相继布局大模型领域。算力位居全国前列、行业生态完善、应用场景丰富的广东省成为布局大模型队列中的佼佼者,不断将算力部署、企业研发、人才等方面的资源优势,转化成抢滩大模型的竞争优势。

  日前,南都·湾财社推出“科创年度关键词”系列策划,作为策划的第二篇关注AI大模型。聚焦在“百模大战”中,广东如何通过制度引领、平台优势以及企业创新等举措,提前卡位大模型产业,针对大模型发展所面临的技术门槛、人才紧缺和人工智能治理等问题,交出优秀答卷。

  去年展开“百模大战”

  行业生态将重塑  

  “我们正处在全新起点,这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”在2023中关村论坛上,百度CEO李彦宏表示,“10年后全世界有50%的工作会是提示词工程。”

  2023年,以ChatGPT为代表的AI大模型的惊艳表现,让大模型成功破圈,让行业内外看到了实现通用人工智能的路径。与此同时,围绕AI大模型而展开的“百模大战”也正式拉开序幕。

  据不完全统计,截至2023年8月,中国已发布的各类大模型数量超百个,截至2023年10月,拥有10亿参数规模以上大模型的厂商及高校院所达到了254家。另据《大语言模型综合能力测评报告2023》,模型参数规模大于百亿级别的大模型产品达15个,包括百度ERNiE 3.0模型、华为盘古模型、阿里遵义模型、腾讯混元模型和网易伏羲模型等。

  “以ChatGpt为代表的大模型的出现,让深度学习模型不再是一个算法工具,而是具有知识性,成为关键决策者,乃至于大模型已成为许多公司的标配。”阿里巴巴智能信息事业群、夸克AI视觉技术负责人黄锐华表示,“甚至可以说,过去是人在用大模型,现在是人在训练大模型。”

  南都·湾财社采访华为、网易、腾讯等企业发现,这些大模型“领头羊”们已在AI领域深耕多年。相关资料显示,2019年至2020年,华为云盘古大模型就投入AI大模型研发,2021年4月,华为云盘古大模型正式对外发布;网易人工智能自2011年起即专注于计算机视觉、自然语言处理、语音交互、模式识别、深度学习等技术研究领域;腾讯则从2016年开始投入AI基础研究,从2021年开始先后研发了多个千亿和万亿级参数的大模型。

  网易集团高级副总裁胡志鹏在接受媒体采访时表示,网易伏羲人工智能实验室在2018年就着手训练AI大模型,脚踏实地把AI的产业应用作为头号任务。

  国产大模型广泛应用于能源、金融、教育、医疗、交通、政务等领域。从2023年10月开始,国产大模型相继迎来版本升级以及技术创新,文心大模型发布4.0版本,讯飞星火认知大模型V3.0版本发布并声称医疗领域能力超越GPT-4,腾讯混元大模型自研机器学习框架Angel再次升级并宣布千亿级大模型训练可节省50%算力成本。

  2023年8月31日,国内11家通过《生成式人工智能服务管理暂行办法》备案的AI大模型产品陆续上线,面向全社会开放。开源证券研报指出,这使得大模型能够大量获得真实用户数据反馈,加快大模型迭代速度。  

  行业生态初显现

  “百城竞赛”又兴起  

  虽然在AI领域积累已久的互联网巨头具备先发优势,但中小厂商可以利用在垂直品类场景和数据层面积累的优势,走出一条创新之路。

  “头部企业研发基座模型,一些中小企业结合自己的需求,对基座模型进行优化,满足垂直行业的应用需求。”中山大学计算机学院副教授张青认为,随着应用范围逐渐扩大,目前AIGC的产业生态也在逐渐形成:以预训练模型为代表的基础层,以垂直化、场景化、个性化模型为代表的中间层和以图像、语音、文字生成等各类AIGC应用为代表的应用层。

  “我们需要将通用的算法改造成家具行业的专用算法。比如在家具行业中,户型是非常个性化的场景,存在各种弧形、圆弧乃至于各种异形的户型设计,需要我们投入大量精力,将通用算法进行深度调优,与落地场景相匹配。”据广东三维家信息科技有限公司PMO兼解决方案首席专家邹明介绍,“在构建好知识图谱之后,我们也想训练自己的大模型,但又发现我们的数据并不通用,需要对市面上的通用大模型进行改造,适配家具行业数据并调整成垂直大模型,其中不仅有技术卡点的挑战,也有技术标准、合作适配、数据量不足等各方面的难题。”

  因此,张青认为,发展大模型产业链上下游要做好分工。他表示,如阿里、百度、腾讯、华为等拥有海量数据及计算能力的头部企业可以攻坚基础通用模型,然后通过开源或者定制等方式将大模型能力释放给中下游企业,让中下游产业针对自身业务情况进行调整与适配,进而去服务更垂直的行业场景和用户。

  2023年以来,南京、深圳、无锡、杭州、重庆、成都、武汉、上海等城市相继出台人工智能专项政策。在2023年5月,中国科学技术信息研究所发布的《中国人工智能大模型地图研究报告》显示,中国10亿参数规模以上的大模型已发布79个,主要集中在北京和广东,其中北京有38个大模型,广东有20个大模型。

  在算力底座基础方面,广东目前拥有鹏城实验室、韶关数据中心集群、横琴先进智能计算平台、广深超算中心等重大算力设施平台。同时,广东目前拥有7家国家新一代人工智能开放创新平台和16家省级新一代人工智能开放创新平台,其中“鹏城云脑II”可提供支撑近千个国产AI模型的训练任务,成为国家最重要的AI大模型训练平台之一。  

  技术门槛待跨越、人才紧缺

  人工智能治理挑战多  

  2023年,大模型技术短板以及发展阻碍也随之显示。

  腾讯方面向南都·湾财社记者透露,目前,高质量语料的缺乏正日益成为限制大模型发展的瓶颈。高质量语料的多样性涵盖不同类型的文本,如新闻、小说、诗歌、科技文章等,这有助于大模型学习到更丰富的语言表达。对于高质量语料短缺的问题,业内目前主要采取语料清洗筛选、标注分类、预训练语言模型、建立共享和协作的平台等方式。

  同时,华为方面认为,在训练上,面临着万卡/十万卡集群分布式训练及可靠性的挑战;在推理上,需解决面向LLM长文本生成的高效解码的挑战;在高效资源利用方面,面临着AI集群碎片资源利用及全局作业最优调度的难题;在大模型压缩方面,需解决高效量化及无损量化评测标准及技术方案的难题。

  此外,AI大模型还需解决行业训练数据安全可控、可用不可得,大模型幻觉缓解甚至消除及可解释性,如何构建具备强大逻辑推理与规划能力的大模型,基于图数据的大模型知识增强技术,通用结构化数据及时序数据特征对齐及预训练等难题。

  “当前大模型发展面临高质量数据集缺乏、人才数量不足等困难。”广东省人工智能产业协会常务副会长兼秘书长张崟向南都·湾财社表示,“目前我国主流数据集多以英文为主,缺少中文数据集。国内数据集质量仍有待提升。”

  另外,《产业数字人才研究与发展报告(2023)》显示,人工智能面临着人才总量与质量的双重欠缺,算法研发与开发人才紧缺度高。

  同时,对外经济贸易大学法学院副教授张欣接受南都·湾财社采访时表示,目前大模型治理主要面临四个挑战:治理滞后、技术鸿沟、资本逐利导致技术异化、协作机制尚不健全。

  “2023年,大模型治理的法治化特征日益凸显,从早期以科技伦理、技术标准、自律承诺等为代表的软法治理,逐步转向更为成熟的‘软法与硬法双轨并行、刚柔并济’的新型治理模式。”张欣介绍道,其中,广东将科技伦理治理结合地方特色和区域特色予以细化,不仅有利于凝聚技术、产业、政策等各界共识,还可以在技术研发早期发挥约束和指引作用,成为地方科技伦理治理的亮点与标杆,为企业研发提供更加明确的预期和积极的制度激励。

  腾讯相关负责人表示,关键还是要把底层的算法、算力和数据扎扎实实做好,而且更关键的是场景落地。

  高端访谈

  广东省人工智能产业协会常务副会长张崟:

  大模型高质量数据集缺乏 人才数量不足

  聚焦于“大模型”领域,本次南都·湾财社特邀广东省人工智能产业协会常务副会长兼秘书长张崟进行专访,回顾广东在“大模型”领域作出的亮眼成绩及未来展望。

  在张崟看来,发展人工智能大模型,广东有三大方面的优势:一是算力位居全国前列,二是产业生态完善,三是应用场景丰富。目前大多数企业在大模型的应用上仍处于初步探索阶段。同时,广东发展人工智能大模型仍面临高质量数据集缺乏、相关人才数量不足等挑战。

  大模型数量居全国第二

  广东在算力、产业生态、应用场景具优势  

  南都·湾财社:2023年,广东在推进人工智能大模型发展方面取得哪些进展和成绩?

  张崟:广东省大模型发布数量全国领先,集中在深圳、广州。截至2023年12月底,我国共有23个省份发布了237个人工智能大模型(包含港澳台),广东为33个,其中深圳17个、广州11个、东莞3个,珠海为2个,仅低于北京(84个),大模型数量位居全国第二。具体而言,目前,广东拥有华为、腾讯、维沃、oppo、云天励飞等9个通用大模型,佳都、远光软件、金蝶、广电运通等24个垂直大模型。

  南都·湾财社:2023年以来,“百模大战”鏖战正酣。《中国人工智能大模型地图研究报告》显示,目前中国10亿参数规模以上的大模型已发布79个,其中广东有20个大模型。在您看来,发展人工智能大模型需要具备哪些条件?广东的优势在哪些地方?

  张崟:人工智能大模型的发展需要数据支持、算法提升、算力支撑,以及场景培育,四者缺一不可。对于广东而言,较为明显的优势主要三个方面:一是算力位居全国前列。全省拥有约230个通用算力数据中心,合计标准机架数量约62万个,占全国9.5%,智能算力方面,以广州人工智能公共算力中心、鹏城云脑、横琴先进智能计算中心为代表的智能算力平台为大模型的优化提升提供了重要的底层支撑。

  二是产业生态完善。广东在产业配套、生态环境、资本支持等五个方面展现了全面的优势。以智能硬件设计为例,广东已形成一个协同闭环。即便是在涉及一些新颖的智能硬件设计时,产品的生产也能够以更为高效的方式完成。此外,广东是全国最大的工业机器人、智能手机、智能家电终端产品的生产和应用地区,为人工智能的应用提供了丰富的机会。因此,现有终端产品与大模型结合应用,以及结合大模型开发新的智能终端产品,是广东需要重点关注的地方。

  三是应用场景丰富。广东经济体量全国第一,同时也是制造业大省,在金融、政务、城市治理、制造、医疗等方面对人工智能具有广泛的应用场景和产业融合需求。  

  大模型应用处于探索阶段

  高质量数据集缺乏、人才不足  

  南都·湾财社:目前,大模型在广东企业中的应用情况如何?哪些领域应用最广泛?

  张崟:从应用行业来看,服务业的人工智能应用明显高于制造业,金融、医疗健康(包括医学影像和病例分析)、教育(智能化测评)较为广泛。在制造业中,特别是汽车制造领域,人工智能被用于分析零部件尺寸、形状等特征,为企业提供更精确的生产调度方案。

  目前大多数企业在大模型的应用上仍处于初步探索阶段,主要应用集中在办公效率提升、内容创作编辑、客服服务与支持等方面。

  南都·湾财社:在您看来,目前大模型发展存在哪些困难和挑战?

  张崟:大模型面临着如下困难:首先,高质量数据集缺乏。数据集是人工智能训练的重要基石,数据集质量对国内大模型性能有直接的影响。目前我国主流数据集多以英文为主,缺少中文数据集。同时,国内数据集质量仍有待提升,数据集种类和内容缺乏多元化,专用领域数据集基本空白。国内大模型企业使用的数据集主要来自国外开源社区和平台机构,由于中文数据较英文更难获取、国内厂商资源投入不足、训练调试不足等,一定程度上影响国内大模型性能表现。

  其次,相关人才数量不足。《产业数字人才研究与发展报告(2023)》指出,在数字产业化人才方面,人工智能面临着人才总量与质量的双重欠缺,算法研发与开发人才紧缺度高。

  南都·湾财社:人工智能还有哪些关键技术需要加强攻关?广东又在攻坚克难中做出哪些努力?

  张崟:未来,人工智能将按照“单体智能-协同智能-自主智能-群体智能”的路径来发展。单体智能更多单个终端产品拥有感知决策能力,协同智能指多设备互联互通,以及人机协同,自主智能指智能终端产品按照任务目标自主完成任务,无需外部控制,群体智能则是多个智能体相互协作,形成群体智慧。在这一技术路径下,群体智能、类脑智能、具身智能、人机混合智能等技术尤为重要。

  广东持续加大人工智能技术的支持,推动人工智能产业发展。在政策支持方面,先后制定印发《广东省新一代人工智能发展规划》《广东省人民政府关于加快建设通用人工智能产业创新引领地的实施意见》(以下简称《实施意见》)等,明确提出加强大模型技术和共性关键技术的支持。在科研创新方面,广东省面向人工智能与数字经济的重大战略需求,依托省内高校共建,设立了琶洲实验室和鹏城实验室等省重点实验室,推动核心技术研发及产学研融合发展。

  广东省也在不断加快培育壮大人工智能产业专业技术人才队伍,一批重点高校成立了人工智能学院,布局大数据智能、协同智能以及人工智能前沿技术和跨学科交叉领域,支撑人工智能产业高质量发展。当前,协会正在有序开展广东省人工智能工程技术人才职称评审工作。同时,也在积极开展人工智能训练师的培训工作。  

  产业政策强力支持

  政务领域将掀大模型应用高潮  

  南都·湾财社:《实施意见》聚焦广东通用人工智能产业创新发展重点,提出22条政策举措。这份文件对广东发展人工智能大模型有哪些积极影响?

  张崟:《实施意见》的出台,在数据、算法、算力、应用和生态等方面提出了针对性的建议,为人工智能产业的发展明确了指导和方向,标志着广东省将人工智能作为战略性产业进行重点布局和谋划。

  为贯彻该政策,各级各部门将相继制定一系列人工智能相关政策,形成有力政策组合,以全面支持大模型的健康发展。在政策的强力支持下,市场信心将得到进一步巩固,企业注册数量、投融资金额等方面将迎来明显的提升。同时,作为制造和应用优势明显的地区,政策支持将快速推动大模型场景的开发和应用,助推传统产业实现蓄势赋能。

  南都·湾财社:我们留意到,2024年开年,广东出台构建政务通用大模型的相关政策,这个政策释放出什么样的信号?2024年,广东又将在人工智能大模型领域有哪些重点工作?

  张崟:《广东省加快数字政府领域通用人工智能应用工作方案》的出台,明确了以场景带模型、模型带产业发展的思路,未来在政务领域掀起一轮大模型应用高潮,推动产业应用成为重点工作。2024年,政数局将在数据挖掘和标注方面持续发力,为大模型的发展提供大量的高质量数据集,2024年拟筹建广东省数据标注联盟,推动广东省数据资源利用。同时,根据政策要求,也将推动大模型在数字政府建设的力度。

  与此同时,各地市将围绕《实施意见》,制定并出台相关政策文件,重点将集中在算力支撑、数据共享和场景应用等方面,并将实施有针对性的资金补贴政策。此外,将开展一系列行业大赛、论坛会议,以推动产业链各方深度参与和合作。同时,明年将针对大模型发展所需的人才培养进行重点工作。  

  南都调研

  总第188期

  策划:王莹

  统筹:任先博

  采写:南都·湾财社记者 陈培均 彭乐怡 徐劲聪