体量如此庞大的数字经济,有赖于背后云计算技术的飞速发展,有赖于国际领先的科技企业提供的新一代算力、存储等IT基础设施解决方案,正是有了这样强大的IT基础设施,才有了金融、制造、电信等领域的提质增效和数字化转型。
面对如今云计算、大数据、人工智能等技术的深入产业和进一步发展,当下企业在进行数智化转型过程中,又将需要怎样的新算力?
在近日至顶科技与新华网客户端联合打造的《对话数字中国》栏目中,由至顶科技CEO兼总编辑高飞主持,国家标准委云计算专委会委员&国内数据中心算力基础设施与绿色节能领域资深专家张昆、拜耳医药保健有限公司处方药事业部数据科学与客户洞察总监王威、英特尔首席架构师许渊、HPE中国首席方案架构师武刚共同参与了主题为《企业数智化转型,需要怎样的新算力?》的高端对话。
在这次对话中,几位行业专家一同深入探讨了如何通过技术创新应对数字经济需求和智能变革挑战,由此为企业带来更高效、更智能、更绿色的新一代智算解决方案。
01 通用算力再提升
数字化、智能化已经成为当下全球各大产业的主流发展趋势,我国金融、通信、制造等各类产业中的企业也都在加快数智化转型步伐,在这一过程中,以数据中心为典型代表的算力基础设施的重要作用日益凸显,如今的数据中心已经成为不容忽视的新型基础设施。
面对这样的发展趋势,国家标准委云计算专委会委员&国内数据中心算力基础设施与绿色节能领域资深专家张昆认为,当下数据中心应该从两个方面提升能力:
一是适应更加多元的算力性能需求。
面对不同应用时,数据中心会幻化成不同形态,例如AI智算中心、高性能计算中心、云计算中心,乃至满足最基础的办公上网需求的机房或者数据中心。不同应用对于硬件基础设施的架构设计、传输效率、功率密度有着不同的要求,一些数据中心需要更多GPU,一些数据中心需要NPU或特殊的CPU,有些则对网络、存储性能有更高要求。
二是用更低成本满足多元化算力需求。
目前要通过更低成本满足多元化算力需求有两条路径:
第一条路径是通过智能数据中心管理平台来实现,用AI来管理数据中心,通过数据中心去支撑AI,由此可以实现从AI到数据中心,然后又回到AI;
第二条路径是寻找性能更强、融合性的新型CPU,这样的CPU需要有更多核心、更强的适应能力。
作为数据中心处理器的主要供应商,英特尔同样看到了数据中心对于算力的多样化需求,英特尔首席架构师许渊指出,“面对不同场景需要不同算力的客户,英特尔在去年发布第五代英特尔®至强®可扩展处理器增加了AI相关能力后,今年发布的英特尔®至强®6处理器不再只有一种核心,而是分为了能效核和性能核两种核心。”
实际上,英特尔今年面向数据中心的处理器——至强系列处理器进行了一次重磅的品牌升级,升级后不仅品牌命名更为简介,还先后在6月和9月分别对外发布了英特尔®至强®6能效核处理器和英特尔®至强®6性能核处理器。
英特尔®至强®6能效核处理器专门针对高核心密度和规模扩展任务所需的高效能进行了优化,适用于微服务等任务并行、基于标量的工作负载,英特尔®至强®6性能核处理器则针对高性能计算进行了优化,单核性能得到了进一步提升,适用于通用计算、数据和Web服务、科学计算、AI等场景。
作为更为直接的数据中心解决方案供应商,无论是服务器、存储等硬件基础设施,还是DataFabric数据平台、Cloud Phsics解决方案,HPE已经有诸多成熟的数据中心解决方案,不过,HPE中国首席方案架构师武刚表示,“随着时代的发展、AI的到来,HPE自2016年开始就在面向AI进行架构演化,诸如针对SGI、Determined AI、MAPR的收购,到现在Opsramp平台和解决方案的构建,这些都为未来打造HPE的AI工厂奠定了基础。”
正是基于这样的前瞻布局以及与英特尔的强强联手,在过去几年里,HPE为AI环境的构建,以及产业从多核时代走到生成式AI时代,提供了不容忽视的支持。
在这样的算力基础设施持续升级、多元化进程中,医药行业得到了快速发展。
拜耳是一家拥有150多年历史的生命科学企业,致力于医药保健和农业领域的创新,拜耳医药保健有限公司处方药事业部数据科学与客户洞察总监王威指出,“真实世界数据的爆发式增长为医药行业带来了快速发展的机遇,如今医院数据已经可以联网,每位患者可以方便地查询到自己的检查结果,监管机构也得以用AI方式进行药品监管,制药企业借助算力基础设施升级实现数字化转型,以此提升业务运营效率……。”
医药行业这些变化都得益于算力基础设施的发展,也对算力提出了更高的需求。
当然,拜耳在医药领域的创新发展,同样离不开对人工智能技术的应用。
02 AI场景再优化
医疗保健作为拜耳的核心业务,拜耳已经在医疗保健中的医疗影像诊断中开发了大量AI应用,以此帮助放射科医生减轻工作负担、提升诊断效率。
据王威透露,拜耳现在已经在通过生成式AI和云计算技术,帮助企业构建可扩展的AI软件,“通过加速开发和部署AI医疗应用,我们希望将不断增长的医疗影像数据转化为有价值的洞察,优化工作流程,并最终落实到患者照护等场景中。”
医疗影像形成的数据在医疗行业中占比将近90%,这些数据不仅数据量庞大,而且数据复杂度高,因而对算力也提出了很高的要求,王威指出,“全球每年产生数十亿张医疗影像仍在继续增加处理和理解这些图像的工作量,我们需要基于强大算力开发和维护新知识的AI工具,从而有效处理和分析这些数据。”
就在人工智能技术场景化对算力提出更高需求时,英特尔也看到了这样的AI算力需求并就计算架构针对AI做了大量优化和技术创新。
许渊指出,从我们视角来看,英特尔将AI算力分为三个阶段:
第一,数据准备阶段,这一阶段涉及各类数据采集和预处理;
第二,数据训练和调优阶段,数据训练和调优需要更强的算力,我们需要把模型一遍一遍进行训练,从而达到最优效果;
第三,数据推理阶段,我们看到越来越多客户希望把场景和算力结合起来发挥最大作用,这也是在推理阶段我们需要考虑的。
实际上,英特尔早在2018年的架构日上就对外提出了XPU战略,即由标量(Scalar)、矢量(Vector)、矩阵(Matrix)、空间(Spatial)组成的SVMS架构,分别对应CPU、GPU、加速器和FPGA,可以进行多种异构组合。
三年后,在2021年的架构日上,英特尔对外发布了两类x86 CPU内核、两大数据中心SoC、两款独立GPU,以及变革性的客户端多核性能混合架构。
英特尔这样的战略布局和产品矩阵,覆盖了从数据准备、训练、调优到推理的全过程,这其中,英特尔不仅提供高性能的AI加速芯片,同时也提供了高性价比的AI加速芯片。
许渊特别指出,“一提到AI加速,我们普遍会想到设计专用的芯片或单元,从英特尔角度来看,我们希望在通用计算平台上也能拥有一定的AI加速能力,从而降低总体拥有成本,所以我们在英特尔®至强®6处理器中,在传统的英特尔®AMX指令集中加入了对FP16数据类型的支持,从而支持更多模型。”
2022年11月30日,ChatGPT的面世拉开了生成式AI的大幕,也让人工智能技术更进一步,武钢认为,“如何对包括生成式AI在内的人工智能技术进行有效利用是目前产业的主要发展方向。”
为此,HPE正在基于AI原生架构搭载自有AI基础设施,例如通过基于机器学习的数据管理平台解决数据准备工作,基于开发环境提供数据开发技术支持,基于MLIS提供推理服务,与此同时,HPE也在构建基于云的AI训练和推理,以此应对人工智能时代对于数据中心的独特需求。
智能化是当下全球企业面临的另一个转型机会,然而,企业需要的往往不只是新技术,而是更为实际的产业价值,如何基于企业现有知识库、语料库等打造人工智能解决方案,并通过这样的解决方案为医疗、制造、生命科学等领域带来实际价值就成了关键。
HPE中国首席方案架构师武刚认为,“未来企业一定会从传感器在边缘侧搜集数据到AI推理形成的决策参考、人工决策,最终走向RPA,乃至完全自动化,并形成相应的混合解决方案。”
面对这样的行业趋势,HPE自2016年起陆续推出了HPE Primera、HPE Alletra等智能存储解决方案。也正是基于这样的产品和解决方案,HPE与玛莎拉蒂MSG车队合作,通过采用HPE服务器和解决方案将赛道数据实时同步到位于摩洛哥的总部,并打造出了具备人工智能技术优势的边缘设备,车队采用HPE Nimble存储和搭载了英特尔®至强®处理器的HPE ProLiant DL360 Gen10服务器,在确保数据安全的同时,实现了数据快速处理和AI工作负载的性能优化。
至于应该如何优化数据中心架构才能让AI算力更好地服务于产业,张昆认为需要考虑两方面因素:
第一,解决好资源总量的限制问题。
数据中心的资源投入总量和实时性要能够满足快速增长的AI大模型应用需要,实现存储和计算的高效协同,以及AI推理训练过程中海量运算可容忍时延与数据中心整体运行效率之间的最优平衡。
第二,要能够满足不断变化热点需求的实时性挑战。
当前全球数字经济发展势头迅猛,各类应用热点变化很快,如何在整体算力资源基本充足但分布结构不均衡的前提下,通过高效合理的资源调度来更好地满足那些新兴局部热点应用所提出的算力支撑要求,需要为数据中心量身定制一套先进适用的智能化监测管理系统,从而实现对数据中心各类软硬件资源的实时监测全覆盖和资源调度智能化。
在监控上不仅要实时监控设备运行故障,还要监控资源供需压力和矛盾,通过智能化监测管理系统和算法优化来实现资源分配的安全合理和及时高效。
这是人工智能技术迅猛发展对算力基础设施提出的独特需求,当然,这不是算力基础设施需要面对的唯一挑战,绿色低碳是算力基础设施在人工智能时代需要应对的另一挑战。
03 绿色低碳可持续
全球已建成或处于不同建设阶段的数据中心已经超过7000个,如果这些数据中心全部运行起来,每年耗电总量将会达到508太瓦时,这一耗电量比澳大利亚或意大利全年的总发电量还要多。
数据中心耗电量激增,同样源于人工智能技术迅猛发展带来的算力需求。
据《纽约客》杂志此前报道,OpenAI的ChatGPT每天耗电超过50万千瓦时用于处理约2亿用户的对话请求,相当于美国家庭日用电量的1.7万倍还要多。
面对与日俱增的电力需求,数据中心如何实现绿色低碳发展就成了另一个重要挑战。
张昆指出,数据中心面向绿色低碳目前主要有三种思路:
第一,尽可能采用新技术、新方案从而达到两个效果:第一个效果是进一步提高单体散热效率,例如采用液冷、自然冷却等来实现;第二个效果是进一步降低设备功耗,例如通过降低服务器功率或减少非必要能源损耗来降低功耗。
第二,进一步加强数据中心内部节能管理,使用智能能耗管理平台全方位监控数据中心内部能耗并通过AI技术做出智能化判断,从而减少不必要的电量损失,例如及时发现能耗异常点并有针对性地提出智能化解决方案,进一步优化空间布局、功率、能量分配,甚至在大型数据中心实现无人无感或低照度智能运维。
第三,在数据中心内部进一步提高可再生能源供给和使用,例如增加太阳能、风能、冷源水能,以及自然低温环境等的应用。
作为已经作出承诺要在2040年实现前,在整个运营过程中实现温室气体净零排放的英特尔一直在从产品、供应链、产业标准多个层面推动绿色低碳。
从产品层面来看,英特尔在今年特别推出了针对能效提升进行了产品设计的能效核(E-core),据许渊介绍,“与第五代处理器相比,英特尔®至强®6能效核处理器每瓦性能提升了1.5倍,这意味着同等负载下能源消耗将会大幅降低。”
从标准制定层面来看,英特尔推出了DC-MHS 服务器行业设计标准、发布了绿色数据中心技术框架,联合行业合作伙伴发布了《绿色数据中心创新实践——冷板液冷系统设计参考》,许渊指出,我们在中国也在与很多合作伙伴一起推动液冷标准持续落地。
英特尔自身践行绿色低碳的一个数据是,2020至2021年,英特尔在中国节电近2200万千瓦时。
HPE同样有一整套解决方案来通过低碳排放降低数据中心PUE,例如HPE推出的HPE Right Mix Advisor就是可以监控每一款应用碳足迹的工具,HPE也在研究通过热能再利用和磁悬浮无油压缩提升数据中心的节能减排能力,甚至为数据中心带来额外营收。
据武刚介绍,“我们HPE ProLiant DL360 Gen10到HPE ProLiant DL360 Gen11这样的服务器更新换代,就可以节省75%的碳使用。”
当人工智能技术再次成为全球热潮时,企业数智化转型也迈入了一个新的阶段,这时,以数据中心为代表的算力基础设施开始面临新的需求和挑战,至顶科技CEO兼总编辑高飞对此也指出,“如今的数据中心已经变成了一个庞大的智能体,本身也在进行着数字化、智能化改造,关于数据中心的绿色、能效和性能,我们需要更多考虑其中的平衡之道。”