BBIN·宝盈集团- 并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025
2026-03-12 19:38:10||273次|新闻资讯

导语:并行算网已经接入62个算力中央,已经累计输出超200亿核时、近2亿卡时。

2025年12月12-13日,第八届GAIR全世界人工智能与呆板人年夜会于深圳·博林天瑞喜来登旅店正式启幕。

作为AI 产学研投界的标杆嘉会,GAIR自2016年开办以来,始终苦守“传承+立异”内核,始终致力在毗连技能前沿与财产实践。

于人工智能慢慢成为国度竞争焦点变量确当下,算力正之前所未有的速率重塑技能路径与财产布局。13日举办的「AI 算力新十年」专场聚焦智能系统的底层焦点——算力,从架构演进、生态构建到财产化落地睁开体系会商,试图为将来十年的中国AI财产,厘清要害变量与成长标的目的。

并行科技副总裁、AI结合开创人赵鸿冰于「AI 算力新十年」论坛发表了主题为《基在用户视角的算力办事和算网办事》的演讲。

历经18年超算范畴深耕,并行科技见证并介入了中国算力市场的演进。当前,算力市场出现多场景、多业态的发作式增加,从尖端超算到智算形态,从算力租赁到算力收集,行业生态日益多元;与此同时,年夜模子技能的快速迭代,也对于算力的可用性、高效性与性价比提出了更高要求。

于如许的配景下,从用户视角构建算力办事系统、经由过程算力收集实现资源的高效整合与调理,以和应答推理需求发作带来的财产厘革,成为算力行业亟待解决的焦点问题。

赵鸿冰于演讲中指出,当前算力市场已经形成四年夜焦点业态:算力租赁作为最基础的形态,以“裸金属”算力资源持久交付用户且不介入后续运用;算力办事聚焦用户终端需求的“末了一千米”,焦点是按需提供精准适配营业场景的算力撑持;算力运营则依赖繁杂调理平台兼顾治理资源,实现算力的高效分配与运营;而算力收集作为更高维度的形态,经由过程纳管多个算力平台形成广泛笼罩的收集,告竣跨平台总体调理。

为此,并行科技推出“厂网联合”模式:“厂”即公司投入年夜量资金设置装备摆设的万卡集群等重资产结构,“网”则是经由过程轻资产扩张毗连海内47个智算中央与15个超算中央,该算力收集可调理200万CPU焦点、5万多张GPU卡,办事超16万用户,贸易化输出累计超200亿核时、近2亿卡时。

于算力资源适配方面,他夸大“没有绝对于最优的算力资源,只有最适配的选择”:例如于B200集群实测中发明,虽B200机能领先,但针对于某具身智能客户需求,H200性价比更优。

基在18年行业经验与数据堆集,并行科技构建的算力机能猜测模子,于小范围场景下猜测偏差可节制于2%之内,中年夜范围场景下偏差也仅为个位数,能有用支撑用户资源选型决议计划。于年夜范围推理场景中,消费级显卡5090作为“性价比之王”,成为大都客户的首选。(作者持久存眷算力与芯片财产,接待添加微信YONGGANLL6662交流更多信息。)

这些思索与经验,均来自并行科技办事16万用户的真实市场沉淀,其打造的算力收集已经实现天下规模内的资源调理与贸易化输出,但愿能为算力行业的成长提供可借鉴的思绪。

演讲竣事后,雷峰网与赵鸿冰就演讲中说起的“算力收集”、“推理需求”等要害议题,举行了更深切的切磋。如下是雷峰网于不改原意的基础上,按照对于话历程做的收拾与编纂:

对于话环节

雷峰网:您提到算力范围年复合增加率到达52.3%,当前市场已经投入年夜量本钱用在AI基建,为什么算力范围仍能连结高速增加,暗地里的重要鞭策力是甚么?怎样对待市场会商的“算力泡沫”这一说法?

赵鸿冰:人工智能是全世界竞争的制高点,将成为将来数年以致数十年成长的焦点驱动力。一场革命性的财产厘革,需要充足的时间与周期来完成出产力及出产瓜葛的重构,这个历程其实不会一挥而就。当前市场对于 “算力泡沫” 的质疑,焦点于在AI投入还没有形成年夜面积的贸易闭环。但从财产成长纪律来看,每一一次庞大技能革命都需要履历投入期、摸索期才能进入收成期,算力是否为泡沫,时间会给出终极谜底。

另外一方面,于当前的全世界竞争格式下,头部科技企业遍及对于AI赛道抱有FOMO情绪。相较在因过分审慎、投入滞后而错掉行业成长窗口期的价钱,适度超前的算力基建投入可能得到更可期的将来。

雷峰网:您于演讲中提到算力收集,并行算网对于接入的算力资源有甚么要求?算网素质是资源整合事情,必将碰面临诸多好处分配问题,这些问题怎样解决?

赵鸿冰:并行科技已经经打造了一套成熟的算力资源接入尺度系统。咱们会按照资源的范围类型、调理能力、完美水平等多个维度,对于拟接入的算力资源举行分级界说,这套尺度就像“插销与插座”的匹配法则,可以或许实现算力资源的快速接入与收集化输出。资源接入周期没有固定尺度,若资源自己彻底切合尺度,可直接接入;若需要革新,并行科技会协助完成尺度适配,总体周期凡是较短。

关在好处分配,并行科技的贸易模式早已经界说清楚,焦点因此价值分层驱动好处分配。整个算力办事财产链可以拆解为多个价值环节:最前端是面向终极用户的市场推广、发卖对于接与方案设计,这需要铁三角构造中的发卖卖力人、方案卖力人配合完成,解决客户的商务与技能需求;往下是产物平台层,需要具有账号开通、算力调理、计量计费、陈诉输出等焦点能力,这是算网运营的焦点支撑;再往下是售后办事层,咱们成立了7×24小时5分钟相应的保障系统,通例问题由一线工程师解决,疑问问题由二线、三线工程师分层处置惩罚,确保客户营业不变运行;最底层则是办事重视资产投资与IDC托管的价值。

于算网互助中,咱们会按照互助伙伴的上风,匹配对于应的价值环节。好比有的互助伙伴拥有IDC及办事器资源,就能够获取底层两部门价值;若互助伙随同时具有前端发卖推广能力,就能够分患上前端与底层价值,并行科技则重要获取平台调理与售后办事的价值。整个价值分配逻辑清楚,可以或许保障各方的合理收益。

雷峰网:异构算力(CPU/GPU/DCU 混淆部署)虚拟化历程中,算力碰面临损耗,怎样优化虚拟化层开消?

赵鸿冰:关在异构算力虚拟化损耗的问题,当前主流的算力调理形态包括裸金属、高机能集群、云主机及容器。差别形态适配差别的客户场景:假如客户有极致机能需求,直接采用裸金属或者高机能集群便可规避虚拟化损耗;虚拟化损耗重要表现于云主机形态中。

超等计较的焦点逻辑不是切割算力单位,而是将更多小单位毗连起来形成年夜范围并行计较的算力。对于在有小粒度算力需求的场景,需要虚拟化切割时,容器是最优选择,容器技能险些可以实现零虚拟化损耗,是解决虚拟化损耗的主流方案。

雷峰网:行业内遍及将杀手级运用的降生、推理需求的发作,视作破解算力闲置困局的要害抓手,也将其视为下一波算力需求增加的焦点引擎。您怎样判定推理需责备面发作的时间节点与演进节拍?

赵鸿冰:当前市场已经经闪现出明确的旌旗灯号,以OpenAI为例,2025年预估营收将到达130亿美元,这恰是推理营业范围化成长的直接表现。并行科技办事的浩繁年夜客户,也已经经进入推理营业落地阶段,整个行业正朝着推理需求发作的标的目的迈进。

从财产成长纪律来看,技能研发不克不及无穷制推进,终极一定要走向财产化落地,创造社会价值并形成贸易闭环,推理需求的发作是这一趋向的一定成果。国产芯片于当前阶段也能够经由过程更多地满意推理场景需求,来鞭策自身营业的成长。

雷峰网(公家号:雷峰网):推理需求成为算力财产主流需求后,将对于当前的算力基建结构、技能路径选择和贸易模式带来哪些影响?您认为AI Infra公司将来最主要的迭代标的目的是甚么?

赵鸿冰:推理需求成为主流后,算力财产的各个环节都将迎来显著变化。于练习时代,算力竞争的焦点是年夜范围集群的靠得住性与不变性,需要经由过程并行框架优化、checkpoint机制等技能手腕,保障模子练习高效完成。而到了推理时代,除了了靠得住性与不变性的基础要求外,市场对于算力提出了新的焦点诉求:一是更年夜范围的弹性资源调理能力,需要支撑运用随时发作的算力需求;二是更邃密的资源匹配能力,由于推理与练习的运用特性差异显著,好比 DeepSeek的推理历程分为P阶段及D阶段,两个阶段的计较与访存敏感特性彻底差别,必需针对于性匹配算力资源。

对于在AI Infra公司而言,将来最主要的迭代标的目的是紧跟客户需求场景,连续进级产物与办事。岂论迭代技能会带来多高的成本,你都要跟,这是一个贸易化的问题,不是一个技能的问题。

雷峰网:本年超节点这一产物形态很是火热,超节点经由过程高密度集成及高速互联,于通讯时延、硬件协同效率上有显著晋升,您认为这类硬件层面的优化,是否会压缩软件侧的算力优化空间?这个产物形态重要是为相识决甚么问题?

赵鸿冰:并行科技深耕算力办事18年,咱们认为不管是超算还有是智算,素质都是为了更快地完成计较使命,计较历程中触及的数据搬运与节点通讯,都是分外的机能开消,超节点的焦点方针也是经由过程高密度集成与高速互联,降低这些开消,晋升数据传输与通讯效率。

从素质上讲,超节点就是一个小型化的超等计较机。硬件层面的优化,其实不会压缩软件侧的优化空间,反而需要软硬协同才能阐扬最年夜价值。一台机能优秀的超节点,必需搭配优异的软件调理与优化能力,才能充实压榨硬件机能。硬件架构的进级是适应财产成长标的目的的一定选择,软件则需要同步迭代,实现对于硬件的高效驾御。

雷峰网:那末是否可以理解为,具有超算技能堆集的企业,更易得到超节点的能力?

赵鸿冰:确凿云云,超节点的技能逻辑与超算一脉相承。外洋于智算范畴的结构,素质上也是于构建超等计较机,好比Stargate等,于描写上也是于设置装备摆设超算。超节点与传统超算的焦点共性,都是经由过程优化卡间互联、节点间互联,实现年夜范围并行计较。

区分于在,超节点的范围远小在传统超算,传统超算动辄需要上万个、甚至数万个节点,而超节点更倾向在小型化集群,好比英伟达的NVL7二、华为384超节点,素质上都是小型超等计较机。

演讲全文

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

演讲完备视频,详见链接:https://youtu.be/acn8RLPTqHs

如下是赵鸿冰演讲的出色内容,雷峰网作了不转变原意的收拾与编纂:

各人好,今天我想及各人分享并行科技于算力办事与算网办事范畴的实践摸索与心患上。并行科技深耕算力行业18年,以超算营业发迹,于持久的成长历程中,咱们从超算视角出发,基在客户画像与产物定位两个维度,对于当前的算力市场举行了划分。

算力市场的第一类场景,因此我国“河汉”超等计较机为代表的尖端超算范畴。2010年,河汉超等计较机跻身全世界超算500强首位,这种超算重要面向国度庞大科技攻关项目的研发事情,其焦点特性是需要十万核、百万核甚至更年夜范围算力支撑。

第二类场景是通用超算范畴,并行科技对于这一范畴的成长起到了焦点鞭策作用。与尖端超算差别,通用超算面向的重要场景之一是高校师生的一样平常讲授与科研需求,算力需求集中于万核如下,以千核甚至几十核为主,这是并行科技的主疆场之一。

第三类场景是营业超算范畴,重要办事在企业的营业模仿仿真需求,这种算力运用凡是是企业出产流程中的要害环节。

第四类场景就是2016年以来,陪同年夜模子技能发作而鼓起的智算形态,其焦点计较载体为GPU加快卡。从技能指标来看,前三类超算场景的焦点需求是高精度计较,遍及要求FP64双精度,最低也需到达FP32精度;而智算场景的计较精度则年夜幅降低,以FP1六、FP8甚至FP4为主,当前智算也是整个算力市场中增加最快的板块。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

近两年,算力市场迎来发作式增加,各种介入者纷纷入局。从业态形态来看,当前算力市场可分为四年夜类型:

算力租赁:这是最基础的算力办事形态,相称在将“裸金属”算力资源持久交付给用户,用户可自立支配算力用途,算力提供方不介入后续的运用环节。

算力办事:这是面向用户终端需求的“末了一千米”办事,焦点是按需提供算力撑持,精准匹配用户的现实营业场景。

算力运营:其焦点是构建一个繁杂的调理平台,经由过程对于算力资源的兼顾治理,实现算力的高效分配与运营。

算力收集:这是更高维度的算力办事形态,经由过程将多个算力平台纳入同一治理,形成一张笼罩广泛的算力收集,实现跨平台的总体调理。

这四类业态,清楚勾画出当前算力办事与算力收集的市场全貌。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

并行科技的谋划焦点理念,始终安身在用户视角。咱们认为,从算力需求方的角度出发,用户的焦点诉求可以归结为三点:第一是可用,即需要有不变的算力资源供给,且可以或许有用支撑营业运行;第二是好用,算力资源不仅要 “跑起来”,更要具有高效的运行机能;第三是降本,要降低用户的算力利用门坎,以高性价比满意需求,特别是年夜模子练习这种高门坎的算力运用,性价比更是要害考量因素。

“可用、好用、降本”是用户的焦点刚需,并行科技的所有产物平台,均缭绕这三年夜需求睁开设计。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

于年夜模子时代,差别类型的客户对于算力产物平台有着差异化的需求。例如,基模练习场景中,受DeepSeek的影响,仅有少数企业需要年夜范围的算力集群;而垂类模子的研发场景,则笼罩了更为重大的用户群体,这种需求可以经由过程尺度化、高适配性的产物型平台来满意。

并行科技的特点谋划模式,是基在算力收集的轻资产运营模式,其焦点逻辑是“厂网联合”。此中,“厂”代表并行科技的重资产结构,咱们已经投入年夜量资金,设置装备摆设了万卡集群;而“网”则是咱们的焦点成长计谋,经由过程轻资产扩张的方式,更多地把已经建或者于建的算力产能更年夜化的阐扬出社会效益,并行科技已经毗连海内47个智算中央与15个超算中央,共计62个算力节点。

今朝,咱们的算力收集可调理资源总量到达200多万CPU焦点、5万多张GPU卡,办事用户范围冲破16万,营业结构笼罩天下,贸易化输出总量累计超200亿核时、近2亿卡时,于算力办事企业中位居第一。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

从技能层面来看,并行科技的焦点竞争力源在18年堆集的行业数据与技能沉淀。咱们的算力收集办事模式笼罩了包括行业年夜模子研发、文生文、文生视频、AI for Science等于内的多元用户场景,基在海量用户的行业运行特性年夜数据,可以或许快速为用户提供精准的资源选型匹配办事。

以具身智能场景为例,并行科技于华夏区域互助了天下首套2000卡级另外全世界机能开始进的智算算力集群,这也是今朝全世界可以或许量产的机能领先的算力资源。咱们会针对于客户的详细运用场景开展近似CT扫描的特性阐发,输出GPU使用率、FP16与FP8精度下的运行机能等量化数据,以此判定算力资源的现实利用效率。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

算力的素质于在“更快地完成计较”,充实开释GPU等硬件的机能上风。

咱们发明,只管B200的机能体现领先,但针对于某一具身智能客户的需求,H200的性价比更具上风。这一结论也印证了资源选型的主要性:没有绝对于最优的算力资源,只有最适配的选择。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

基在汗青经验与数据堆集,并行科技构建了算力机能猜测模子,输入相干参数后,便可有用猜测算力的机能加快效果。该模子于小范围算力场景下的猜测偏差可节制于2%之内,中年夜范围场景下的偏差也仅为个位数,足以支撑用户的资源选型决议计划。此外,于年夜范围推理场景中,消费级显卡5090是当前的性价比之王,成为大都客户的首选。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

跟着DeepSeek的爆火,MaaS(模子即办事)模式迅速突起,有不雅点认为Token将成为将来算力市场的焦点要素,并行科技也已经结构MaaS平台,紧跟行业成长趋向。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

值患上一提的是,并行科技专门设立了国产事业部,于国产算力资源的适配与运用方面连续发力。例如,华为昇腾910B于部门适配场景中,机能可与A100比肩,且于价格具有上风的环境下,可以或许为用户提供更高的性价比选择。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

末了,我想扼要先容并行科技的市园地位与客户结构。

于客户群体方面,海内前四五百所头部高校均是咱们的焦点客群。以清华年夜学为例,并行科技与清华开展校级互助,为全校6万余名师生提供算力撑持,以更好开展AI的摸索研究。今朝,咱们与复旦年夜学、中国计较机学会(CCF)的互助也已经推进至第二期,取患了优良的成效,使更多高校的师生及科研机构的研究员们享用到普惠的算力。

并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025

除了高校外,科研机构是并行科技的另外一年夜焦点客群,中科院旗下数百家有算力需求的研究所,均已经纳入咱们的精准办事系统。于企业端,美的、三一重工、比亚迪、小鹏汇天等知名企业,以和智谱 等 AI 范畴的标杆企业,也都是并行科技的主要客户。

无庸置疑,AI将是驱动将来数年以致数十年财产成长的焦点引擎,而算力则是这一进程中的要害基石。有专家将算力比作“水电”,这一比方十分贴切,犹如水电支撑社会出产糊口同样,算力已经成为数字经济时代的基础举措措施。相干陈诉显示,算力指数每一增加1个百分点,将动员GDP实现千亿级另外晋升。

将来,并行科技愿与行业同仁联袂并行,以优质的算力办事与算网运营能力,助力科技强国设置装备摆设。谢谢各人!

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-BBIN·宝盈集团


相关阅读

全国服务热线
400-607-5688
公司地址
北京市昌平区回龙观高新四街 6号院1号楼5层
公司邮箱
www@bbin.com
版权所有:BBIN·宝盈集团科技有限公司  京ICP备18004735号-1 京公网安备 11011402010817号
400-607-5688
在线咨询
京东商城
返回顶部
电话咨询
在线咨询
返回顶部