证券日报新闻记者 周春媚
近期,有关大模型的相关政策与对策聚集颁布,喜讯不停传出。7月13日,国信办等七部门共同出台了《生成式人工智能服务管理暂行办法》,激励生成式人工智能应用在各个行业、各个领域的融合创新;可就在信息公布前的一周,上海市人工智能实验室宣布开源系统了“秀才·浦语”大模型70亿主要参数轻量版本号InternLM-7B,适用免费商用,根据这一底座实体模型,各单位与科研机构能够开发设计打造出分别垂直领域的大模型。
这种各项政策,展现了我国推动生成式人工智能技术持续发展和完善运用的心态,也帮领域大模型加快运用带来了更多可预测性。访谈过程中,几乎所有的采访者都向记者表示,领域大模型浪潮下,数据信息直接关系到领域大模型的专业水平与精确度,必要性正持续突显。
这种观点几乎成了一种“领域恰当”,可一个问题却一直索绕新闻记者心中:都觉得数据信息、算率、算法是人工智能技术的三大基本因素,为什么算率跑道这般喧闹,处理芯片、网络服务器、光纤模块等市场热点五花八门,数据信息跑道则显得有一些“难堪”和不冷不热?
实际上,那也是业界很多者的同样体会。总体来看,深层原因与数据产品的独特性、现阶段数据交易市场却不完善等诸多有一定关系。
就数据产品本身而言,其“非标准化”和“无法通用性”的特点,取决于数据产品无法在销售市场中形成统一和“公允价值”其价值。算率因素里的基本硬件配置通常是实价的“钱”,处理芯片、网络服务器等费用都可以测算,可以在不同行业大模型产品研发中通用性,价值容易反映。但是数据价值需在特定场景下完成,数据库的经营规模、品质也难以统一考量。很多碎碎的、非标、个性化的场景营销,让数据产品难以达到规模性运转。
就数据交易市场来讲,现阶段我国在数据合规管理土地确权、计量检定定价、融洽分派、安全隐私维护等方面基本性难点仍待破译,特别是在数据确权层面,尚未形成确立规范和标准。针对领域大模型来讲,数据信息具备公域特性,有一定的获得堡垒,在安全与隐私性上面还有更高要求。一直以来,数据库违反规定搜集、个人信息泄露等安全隐患是世界各国监管部门对生成式人工智能较大顾忌,也是影响大模型落地较大可变性因素之一。在基本性机制和标准暂未确立的情形下,数据交易和网络服务也面临着诸多限制以及阻碍。
但是,伴随着大模型在各行各业的运用持续走深,业内对高品质数据的“难耐”将促进数据信息产业供应链长远发展,有关方面已经积极行动起来。国家工信部电子器件第五研究所副所长王蕴辉详细介绍,现阶段所里早已协同产业链侧建立了“大模型产业应用调研组”,从加快数据要素市场化、健全数据资源安全性社会治理体系等多个方面正确引导并规范市场发展趋势。在实体模型商业化的业务需求刺激推动下,数据生态平台建设有希望加速,数据要素市场也有望迎来长足的兴盛。
大众商报(大众商业报告)所刊载信息,来源于网络,并不代表本媒体观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。大众商报非新闻媒体,不提供任何互联网新闻相关服务。
本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负。如因文章侵权、图片版权和其它问题请邮件联系,我们会及时处理:tousu_ts@sina.com。
举报邮箱: Jubao@dzmg.cn 投稿邮箱:Tougao@dzmg.cn
未经授权禁止建立镜像,违者将依去追究法律责任
大众商报(大众商业报告)并非新闻媒体,不提供任何新闻采编等相关服务
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP备2023001087号-2