编辑《证券时报》 周春媚
走进位于深圳前海的博大数据智能计算中心,一座方形、蓝白相间的建筑尤为引人注目。在这个智能计算中心的机房里,一排排的智能计算机柜排列整齐,服务器运行迅速,进行了复杂的数据分析和计算任务。
“作为一家综合计算能力服务提供商,我们在自己的计算能力集群上部署了DeepSeek-R1 博达数据副总裁白旭告诉《证券时报》编辑:“671B全版本供客户使用,通过直接向用户提供人工智能模型,在市场上创造计算能力需求,从而推动我们智能计算中心高密度机柜和计算能力服务的销售。”。
随着国内大型DeepSeek模型的普及,近年来,来自各行各业的许多公司宣布部署DeepSeek模型,应用程序端的计算能力需求爆发。业内人士表示,DeepSeek通过降低人工智能应用程序的门槛,将计算能力需求从“培训主导”转变为“推理主导”。面对新的行业变化,智能计算中心需要加快转型,从简单的计算能力提供商转变为专业服务提供商,提供覆盖整个计算能力生命周期的专业服务,提高计算能力资源的利用效率。
Deepseek部署热潮
驱动对计算能力的需求增加
最近,企业部署DeepSeek的热情仍然很高。《证券时报》编辑注意到,许多上市公司密集宣布,DeepSeek模型的相关部署已经完成。
例如,2月18日,海看股份在互动平台上表示,公司已部署接入DeepSeek模型,如自主开发的人工智能智能审计平台,并对自己的平台进行微调和优化。同日,卓创信息还发布消息称,DepSeek系列大型模型的本地化部署已经完成,基于DepSeek-R1模型,采用蒸馏技术,努力打造大宗商品行业的大型模型。
“DeepSeek的一个重要意义是推广普通公众的人工智能科学。各行各业的人都知道这个大模型,并试图使用它。这种集中的访问和使用推动了计算能力需求的爆发。”中浩新英解决方案架构师顾立成在接受《证券时报》编辑采访时表示,自今年春节以来,许多客户一直在询问公司智能计算中心和DepSeek的适应情况。”目前,我们的智能计算中心已经能够运行各种蒸馏版本的DepSeek模型,性能非常好。”顾立成说。
作为一个开源模型,DeepSeek以其高性能、低成本的优势,大大降低了人工智能应用的门槛,正成为许多下游人工智能应用公司和终端制造商部署人工智能模型的首选。以不久前正式访问DeepSeek-R1模型的智能芽为例,公司是一家科技创新信息服务提供商,公司技术负责人告诉《证券时报》编辑,DeepSeek开发的开源模型,确实可以帮助企业减少早期开发投资,特别是可以节省高基础设施试错成本。
编辑在接受采访时了解到,企业的需求不仅是本地化部署DeepSeek大模型,还有很多公司会根据自己的行业数据定制开发DeepSeek大模型,培训垂直模型或构建专业应用。
“给我留下深刻印象的是一家律师事务所。客户希望我们能帮助他们利用自己的行业数据定制Depseek,并在自己的专业领域建立智能应用程序。目前,我们正在与合作伙伴合作,努力满足客户的需求。”白旭表示,Depseek有助于加快国内企业的数字化转型。由于人工智能应用场景(如智能审批、数字双胞胎)的扩展,对高密度机柜和边缘计算设备的需求将大大增加。
从“训练主导”到“推理主导”
国产算力芯片厂家迎利好
培训成本低,这是Deepseek不同于其他大型模型的核心优势。虽然Deepseek没有披露R1模型的确切培训成本,但根据V3模型发表时发表的论文,V3培训成本仅为557.6万美元,约为Meta开源大模型培训成本的十分之一。
根据编辑的采访,大型模型主要分为两个阶段:培训和推理。培训是指使用大量数据来培训大型模型,通常需要高计算能力和存储资源;推理是指将培训模型应用于实际任务,如提问和生成文本、识别图片和视频。
“传统的大型模型训练就像吞噬计算能力的黑洞。单一训练的成本往往是数千万美元的巨额投资,建立了只有科技巨头才能克服的技术障碍。计算能力军备竞赛加剧了全球GPU资源竞争,形成了基础模型研发的高度集中模式。”上海经义工业数学智能研究所副院长沈佳庆告诉《证券时报》,DepSeek打破了这一既定的秩序,将促进计算能力需求的重新分层。过去,高度集中的训练计算能力需求将开始扩散到应用程序端的推理计算能力需求。
“早在去年年初,我们就预测,智能计算中心的计算能力需求结构将从‘训练主导’转向‘推理主导’。大型模型培训后,应该有用、有用、易于使用。DepSeek成功地做到了这一点,从而爆炸了。”白旭表示,目前,国内计算能力芯片制造商与国内OEM(原设备制造商)制造商合作推出了DepSeek一体机,国内主要云平台也推出了DepSeek模型服务,大大降低了大型模型应用的使用门槛。
除了推动推理芯片需求的增长外,DeepSeek对国内计算能力芯片制造商的好处也来自于技术层面。顾立成告诉编辑,在DeepSeek推出之前,国内大型模型正处于“百花齐放”的状态。作为人工智能芯片设计和国内计算能力硬件平台解决方案提供商,中浩芯英涉及大量的大型模型适应需求。随着国内大型模型的逐步关注,我们将加快计算能力硬件平台和软件大型模型国内解决方案的定型和市场化。”顾立成说。
事实上,自1月底以来,从云基础设施服务提供商到国内计算能力芯片制造商,DeepSeek模型正在全面适应。在云基础设施服务提供商方面,华为云、腾讯云、阿里巴巴云、百度云等主流云制造商已宣布,DepSeek相关模型已上架,供开发商部署调用。中国移动、中国电信、中国联通三大基础电信企业也全面接入DepSeek。国内芯片公司也“闻风而动”。据《证券时报》编辑的不完整统计,天数智能芯片、摩尔线程、海光信息、云天励飞、悬崖技术、绥远技术、穆西、昆仑芯片等10多家国内芯片公司已宣布适应DepSeek模型服务。
从提供算力到专业服务
智能计算中心迎接转型机遇
DeepSeek的崛起引起了人们对未来计算能力需求的广泛关注。近年来,计算能力板块和二级市场相关股票也出现了较大波动。
沈佳庆认为,短期内,由于Deepseek降低了培训成本,培训环节对大规模计算能力的需求会下降,从而将资源投入到具体解决方案的研发中。“但从中长期来看,Deepseek将增加推理和微调的计算能力需求,并应用原来用于培训环节的部分闲置计算能力;第二,它将刺激基本的大型模型加速迭代,对计算能力的需求可能会增加。”沈佳庆说。
业内人士普遍认为,DeepSeek将对智能计算中心构成长期积极影响。然而,在DeepSeek带来“繁荣”之前,该行业对各地积极建设和蓬勃发展的智能计算中心存在疑问。据编辑采访,近年来,由于人工智能产业的蓬勃发展,全国掀起了智能计算中心规划建设的热潮,大大小小的智能计算中心如雨后春笋般遍布全国。最近,国际数据公司(IDC)根据浪潮信息联合发布的《中国人工智能计算能力发展评估报告》,2024年中国智能计算能力规模同比增长74.1%,显示了中国在智能计算领域的巨大投资。
然而,一些智能计算中心存在利用率低、供需不匹配的问题。沈佳庆分析说,从供应方面看,为响应国家和地方产业规划的政策导向,加上政府鼓励、电信、IT软硬件等国有企业和大型民营企业,坚持“适度先进”的原则,开展大规模智能计算中心建设,导致市场供应井喷;从需求方面看,虽然市场需求增长,但没有明显的井喷。”首先,国内软硬件在效率和应用方面仍存在差距,应用效果低于预期;第二,在产业发展初期,技术还不成熟,企业应从理性的角度考虑产品或服务的多种因素,相对谨慎。”沈佳庆说。
计算能力闲置困扰着中国的许多智能计算中心,而Deepseek可能有助于缓解这个问题。”就像移动互联网的普及一样,当大型模型真正成为人们习惯使用的工具时,它就会爆发出非常巨大的计算能力需求。”顾立成说,提前布局智能计算中心,以确保当需求真正爆发时,智能计算中心能够承受这种“飞溅的流量”。
对于智能计算中心来说,DeepSeeek也带来了新的发展方向和机遇。据白旭介绍,智能计算中心的产品模式不再局限于提供高密度机柜和计算能力服务,而是可以直接部署模型应用于企业。
“智能计算中心应该从简单的硬件建设转向新的发展阶段,主要是提供专业的服务。”沈佳庆认为,计算能力也是智能计算中心从基础资源到生产力工具的市场机遇,真正成为普遍应用。”通过提供覆盖整个计算能力生命周期的专业服务,与产业链中不同的主体合作,提供计算能力调度、计量、优化、微调、包装、维护、二次开发等解决方案,将有效促进计算能力服务在各行各业的渗透和应用,扩大整个计算能力中心的市场需求。”沈佳庆说。
大众商报(大众商业报告)所刊载信息,来源于网络,并不代表本站观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。大众商报非新闻媒体,不提供任何互联网新闻相关服务。本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负。
如因文章侵权、图片版权和其它问题请邮件联系,我们会及时处理:tousu_ts@sina.com。
举报邮箱: Jubao@dzmg.cn 投稿邮箱:Tougao@dzmg.cn
未经授权禁止建立镜像,违者将依去追究法律责任
大众商报(大众商业报告)并非新闻媒体,不提供任何新闻采编等相关服务
Copyright ©2012-2023 dzmg.cn.All Rights Reserved
湘ICP备2023001087号-2