![]()
新智慧报道编辑:丁辉 【新智慧介绍】地球已经连显卡都买不起了,微软的GPU也插不上机房了。 NVIDIA 的 H100 正在直接飞向太空。地球真的“扛不住”NVIDIA GPU!今天看到两条新闻。一是微软已经储备了无数的GPU,但“插不进去”。另一个是NVIDIA H100 GPU被发射到太空构建数据中心。其实这两件事的背后隐藏着一个深层的问题:GPU建好了,但是服务GPU、给GPU供电、为GPU排除热量的支撑基础设施却没有维护!让我们从微软的 GPU 在仓库里积满灰尘的事实开始。微软CEO纳德拉在接受Openai Ultraman采访时透露了一个令人惊讶的事实——微软手中掌握着大量的GPU。但“没有足够的电力”来维持它们的运行。另一个原因是比较实际,缺乏数据ce可以立即“插入 GPU”的机器。纳德拉公开表示:我现在的问题不是没有足够的芯片,而是没有可以插进去的“热壳”。所谓“热壳”是指具有电源和散热条件的数据中心外壳。通过比较你就能很快理解这个概念。从建筑学的角度来说,热壳就是冷壳。冷壳是指通常配备有但很少或没有室内系统安装的建筑结构/外壳。 Warm Shell是一个更准备好的状态,可能主要的建筑系统安装并运行,例如制冷、供暖、通风和空调(HVAC)系统、照明、主要电力/水/消防系统等。AI热潮引发的芯片竞赛现在受到最传统瓶颈——电力的制约。美国电网面临前所未有的压力,科技巨头竞相部署小型核反应堆拯救他们自己。同时,Altman还提到,未来可能会出现“可以在本地运行GPT-5或GPT-6”的低功耗消费设备,这可能会彻底颠覆数据中心现有的商业模式。世界无法支持他们。与奥特曼提出的低功耗设备相比,另一则消息在将其“送”入太空时提供了新的思路。 NVIDIA 使用 StarCloud 的 StarCloud-1 卫星将 H100 送入太空! 11 月 2 日(星期日),NVIDIA 首次将 H100 GPU 发射到太空,以测试数据中心在轨道上的运行情况。这款 GPU 配备 80GB 内存,比任何在太空飞行过的计算机都要强大一百倍。支持者表示,这个想法是有道理的:在远离地面的空旷空间中,数据中心不会占用宝贵的土地,不需要更多的能源和水来冷却,也不会向大气中释放变暖的温室气体。这项为期三年的任务将发射 Bandwagon 4 Falcon 9。d-1卫星重60公斤,将飞行约350公里,在环绕地球的极低轨道上飞行。在那里,它将接收来自美国卡佩拉公司运营的合成孔径雷达(SAR)地球观测卫星的数据,进行实时处理并向地球发送消息。将GPU放置在太空中的优点 在太空中建立数据中心的另一个主要优点是,只需返回少量的数据。由于数据量巨大,合成孔径雷达(SAR)数据的下行传输历来是一个主要问题。但在轨道上处理它的能力意味着我们只需要发送“视图”。什么是视图?一种观点可能是一艘船在某个位置以某个方向以某个速度行驶。这是一个大约 1 KB 数据的小数据包,而不是需要下载的数百 GB 原始数据。简单来说,这意味着保留算法贴近数据源,在本地完成过滤、合并和推理,只返回高价值的“汇总信息”。简单一点(但不一定准确),数据在空间中进行处理,只返回结论。这种方式可以更好地实现低延迟响应,显着节省带宽和能耗,提高弹性(断线/灾难场景下的可持续运行),降低敏感数据泄露的风险。为什么要将 GPU 送入太空?与微软CEO纳德拉的担忧不同,StarCloud正在积极探索这种数据中心模式。就像他们公司的名字一样,Stra Cloud,一个太空数据中心。当然,其主要驱动力不是冷却 GPU。这就是能源和地球资源的瓶颈:地球的数据中心消耗了太多的电力!到2030年,全球数据中心的电力消耗预计将相当于日本全境的电力消耗。与此同时,他们消耗了大量的每天 ts 冷却水(1 MW 中心 ≈ 1,000 人每天)。相比之下,空间有着先天的优势。无限太阳能:轨道上24小时有阳光,无需电池存储。零占地:无需土地建设,不破坏生态。无温室气体排放:不依赖化石能源。归根结底,AI对算力的需求正在爆发。 AI模型越来越大(如GPT、Claude、Gemini等),能源和冷却成本飙升,企业迫切需要新的解决方案。因此,空间数据中心被视为一种长期可扩展的解决方案。通过利用低成本、持续的太阳能并避免使用土地和化石燃料,StarCloud 技术使数据中心能够随着数字基础设施的发展而快速扩展和维持,有助于实现增长,同时保护地球的气候和重要的自然资源。热量会“流失”吗?还有一件事值得一提唯一的是,很多人认为GPU之所以上天,是因为地球太热,太空容易散失热量。其实没有。空间可以失去热量,但是很难。太空中几乎没有空气,因此无法利用风扇或流体循环来带走热量(这称为对流散热)。对流散热是指“热流体(液体或气体)移动,将热量从一处带到另一处的过程”。辐射散热是唯一的出路:辐射散热是“物体通过电磁波/红外线以波的形式散发热量”的过程。该设备通过红外辐射向太空发射热量。散热效率取决于燃烧面积、物质排放和温度。因此,卫星或太空GPU需要很大的散热片(散热器)面积,设计非常关键。在StarCloud项目中,这部分特别得到了加强:他们设计了H100特有的散热系统,利用真空中的高温差和导热材料来实现散热。为了节省电力、土地和地下水,是否可以在太空建立数据中心? StarCloud首席执行官兼联合创始人约翰斯顿表示:“我的预期是,十年后,几乎所有新的数据中心都将建在太空中。原因纯粹是我们在地球上面临的能源限制。约翰斯顿表示,在太空中唯一的额外成本是发射成本。全面运营后的10美元。观测卫星的运营商。https://www.starcloud.com/starcloud-2https://spectrum.ieeee.org/nvidia-h100-space 回到搜狐查看更多