为了更好的体验,请使用竖屏浏览

西南财大大数据研究院院长寇纲:

探索补偿激励机制 破除政企数据孤岛

来源:南方都市报 作者:李玲 黄莉玲 樊文扬 03-16 01:23

  西南财经大学大数据研究院院长寇纲。

  以ChatGPT为代表的人工智能通用基石模型,科技伦理和数据泄露问题如何解决?全国政协委员、民建四川省委副主委、西南财经大学大数据研究院院长寇纲今年带来关于人工智能通用基石模型的提案。

  寇纲在接受南都专访时建议,在现有法律法规中明确人工智能通用基石模型及生成式AI技术和应用中涉及政治、民族、宗教、互联网等相关内容的法律底线和红线问题,推进建设AI内容监控平台。

  谈数字资产交易

  整个市场体系尚未完全建立

  南都:你认为国内数字资产交易现状如何?

  寇纲:虽然数据被列为几大生产要素之一已经有比较长的时间,但数字资产交易仍是一个新鲜事物,国内外在这方面都缺乏成熟的实践经验。如今,国家对于数字资产交易转向了比较积极的态度,但整个市场体系尚未完全建立起来。

  一方面是定价交易混乱的问题。给数据定价是进行交易的前提,而当前数字资产缺乏官方标准进行科学的价值评估,大都采用卖方自主定价的形式,存在极大的价格炒作空间,长远来看这对整个市场的稳定和发展是不利的。

  另一方面,目前存在数据再流通价值缺失、市场活力不足的问题。国家鼓励数字资产的“去币化”,仅允许其进行一次性交易,禁止类金融、类证券化的交易模式。由于缺乏二次交易获利机制,现有的数字资产对不少企图在数字藏品市场创业和投资的长尾用户的吸引力持续衰退,市场活跃度随之降低。

  南都:解决上述问题需打破政企数据“孤岛效应”?你怎么看?

  寇纲:我们在成都的调研结果显示,目前政企数据共享确实存在难度,国家大力提倡“公共数据授权运营”,但运营需求清单同意提供比率不足50%。

  究其原因,首先,我国的行政管理有垂直管理的特点,大量数据归口于不同委办局,国家部委部分下属机构都有着“数据不出部门”的要求,实现数据共享比较困难。其次,由于各自业务标准不同、精度不同、接口接入形式不同,数据颗粒仍偏向宏观,静态数据多于动态数据,导致数据的准确度、精细度、活跃度不足,数据很难使用。

  我建议,一方面,政府部门内部自己要梳理好标准规则,统一数据收集的标准。另一方面,优化现有数据授权机制,减少反复确认的中间环节,减轻部门数据共享顾虑;探索更加符合部门利益的补偿和激励机制,尝试与部门信息化资金挂钩,激发各部门数据流通热情,加大对社保、医保、公积金等高价值数据的保障力度。

  谈算力资源调配

  建立全国一体化AI算力网络

  南都:为什么关注人工智能通用基石模型这一话题?

  寇纲:我认为,ChatGPT等人工智能通用基石模型是未来人工智能真正实现商业化广泛应用的一次突破,发展前景广阔。不过,虽然我国在人工智能领域发展较快,但自主研发的底层创新能力与美国相比还有较大差距,很多关键技术面临“卡脖子”难题。因此,我今年带来了《关于大力发展自主创新的人工智能通用基石模型的提案》。

  我在提案中指出,我国人工智能领域自主研发能力亟待提升。目前我国底层架构软硬件基础几乎都由国外公司垄断,高质量的数据集已成为制约人工智能领域发展的瓶颈之一,比如很多国外数据集限制国内IP或直接不向国内用户提供服务。因此,我建议加大对人工智能基础领域自主研发的创新扶持,包括由工信部和科技部牵头,出台激励和引导人工智能大模型关键技术攻关和应用生态建设专项政策等。

  此外,针对我国算力资源调配协同能力有待加强,各地算力使用分布不均,无法实现跨域的动态调配的问题,我建议促进全国一体化算力网络统筹调度,将各地分布的超算、智算、人工智能计算中心节点通过专线连接,形成全国范围内一体化感知、分配、调度人工智能算力网络,在此基础上实现资源弹性分配。

  谈人工智能发展

  推进AI内容监控平台建设

  南都:国内企业陆续推出自己的语言模型产品,你看好其商业前景吗?

  寇纲:从产业角度来看,我认为它确实有很大的发展前景。过去的人工智能就像“手工定制”,不仅成本高,而且一个模型只能做一件事,比如AlphaGo只会下围棋,换成五子棋就不会了。不同的是,人工智能通用基石模型可以通过预训练,从大量标记和未标记的数据中捕获知识,面对新的任务和场景,它只需要少量的标注,就能达到极好的效果。

  在我看来,人工智能通用基石模型在文本生成、图像生成、音频生成、视频生成、虚拟人、元宇宙等场景均有着丰富的应用场景,未来一定不会仅仅是大厂间的“军备竞赛”,普通企业、创业企业也可以从中受益,可以说是“兵家必争之地”。

  南都:有人担心ChatGPT会让“人工智能取代人类”成真,你怎么看?

  寇纲:取代人类可能是一个过于夸张的说法。相反,我认为对于大多数人来说,这种技术会成为很好用的基础工具,尤其是针对高重复性、有规范性的工作,它会是一个提升效率的好帮手。所以,与其恐惧,不如巧用。

  南都:ChatGPT离不开大数据,科技伦理和数据泄露应如何预防?

  寇纲:由于ChatGPT这样的人工智能通用基石模型依托海量数据库信息而存在,它对信息、数据来源无法进行事实核查,确实很可能会导致提供虚假信息、侵犯个人隐私、泄露商业秘密等问题。比如,如果没有经过权利主体的授权,对部分受著作权保护的文本、视频、代码等进行直接获取、修改和拼凑,就可能涉及新型版权侵权。

  对此,我建议加快互联网相关法律法规修订和伦理规范制定,在现有法律法规中明确人工智能通用基石模型及生成式AI技术和应用中涉及政治、民族、宗教和互联网等相关内容的法律底线和红线问题。同时,加快人工智能通用基石模型带来的知识产权保护研究,推进AI内容监控平台建设。

  A10、A12-16版:

  策划:程姝雯 潘珊菊 蒋琳

  统筹:梁建忠

  采写:南都记者 李玲 黄莉玲 樊文扬 王子黎 胡耕硕 宋承翰 马宁宁 实习生 赵月 许卓涵

  受访者供图