开yun体育网＂它会去实行这些实验-开云官网登录入口开云app官网入口

发布日期：2026-04-09 06:17 点击次数：64

开yun体育网

刻下的软件器具——从编译器到分娩力专揽方法——需要进行根人道的再行想象开yun体育网，以跟上以机器速率使命的东谈主工智能智能体的规范，Google和英伟达的首席科学家示意。

在最近于圣何塞举行的英伟达GTC 2026会议上，Google首席科学家Jeff Dean指出，诚然东谈主类确立东谈主员很少会为C编译器的启动时候感到困扰，但在智能体启动速率远超东谈主类的寰球中，传统器具将导致雄伟的性能蔓延。

Dean示意，编程器具照旧在资格这种滚动，买卖专揽方法也必须跟上。这将使智能体简略操作电子表格和文档以方法化步地索要信息。在与英伟达首席科学家Bill Dally就鞭策AI下一个前沿的频频对话中，他解释了这一不雅点。

此次策动为Google和英伟达的发展道路图提供了珍稀的知悉，展示了从领导-恭候式AI向具备自我改进、计划以至想象我方后继者能力的智能体系统的卓绝。

自主研发

关于Google来说，鞭策AI的下一个前沿意味着赋能模子行为自主的研发实验室。

当Dally臆想Dean行业距离简略实验、整理数据并老师下一版块我方的AI模子还有多远时，诚然Dean承认这种能力"还不完全进修"，但他指出了神经架构搜索的出现，这允许用户自动化神经收集的想象。

"你不错用当然言语指定臆想空间，比如'请探索风趣的新蒸馏算法，并尝试使用咱们现在莫得使用的信息'，"Dean说。"它会去实行这些实验。这基本上是臆想和分娩力的超强力倍增器。"

已毕这一指标需要模子打破老师罢休。模子不是一次性在所有这个词互联网数据上进行预老师，而是不错在某些环境中罗致行动或预测谜底，然后再回到学习状况，这将显赫提高学习后果，Dean补充谈。

光速推理

跟着推理瞻望将占据大部分AI使命负载，英伟达正在积极针对通讯蔓延进行优化，以赋予AI智能体无需暂停就能"念念考"的能力。

"当你潜入到弧线的右侧，实在针对蔓延进行优化时，事实讲明大部分蔓延齐来自通讯，"Dally说。"在英伟达，咱们老是提到光速。"

为了减少对数字信号处理和误差改进的需求，Dally表露英伟达正在老师简化的路由器架构，捐躯带宽——从每秒400千兆比特降至200千兆比特——以换取蔓延改善。指标是将路由器蔓延降至50纳秒以下。

"通过这么作念，我不错看到咱们以每秒1万到2万个Token的速率启动相对较大的模子，"他说。

不要移动数据

由于AI消耗大齐动力，Dally提供了一个成功的管制决议来减少动力消耗："不要移动数据。东谈主们在笑，但我是矜重的。这完全是你必须要作念的。"

Dally解释说，对低精度NVFP4操作进行乘加狡计只须耗10飞焦耳的能量。然则，从外部内存拉取必要数据消耗的能量约莫是这个数目的1000倍。

为了管制这个问题，英伟达正在探索先进的3D堆叠工夫，物理交融内存和狡计。"读取DRAM使用的大部分能量本色上不是读取DRAM自己——而是将比特从读取DRAM的位置移动到GPU引脚处所的位置，"Dally说。

"通过将DRAM成功堆叠在实行狡计的GPU之上，咱们不错获取一个数目级更多的带宽，同期每比特消耗更少的能量。这最终是疏浚的功率，但性能要高得多。"

除了硬件立异，驯从AI功耗危险还需要算法后果的大幅改进。"要是你能以更少的使命获取疏浚的精度，这也会减少动力消耗，"他补充谈。

Dally强调了稀薄性——跳过对模子最终输出影响不大的数学参数狡计的工夫——行为功耗裁减的雄伟契机。英伟达在其Ampere架构中引入了二比一结构化稀薄性，刻下的夹杂各人模子使用粗粒度稀薄性步地来浅显狡计。

然则，Dally警告说，追求更高等别的稀薄性会毁坏使GPU如斯高效的高度顺次、可预测的狡计模式。"当你毁坏这种模式时，你需要更多的界限和数据路由来处理不顺次性，"他说。

AI构建我方的基础设施

这种智能体的翌日照旧在英伟达和Google我方的工程团队中成型，AI正在想象下一代芯片。

Dean指出了Google在芯片想象中使用AI进行布局和布线的奏效——援用其备受赞美的AlphaChip臆想——而Dally详备呈报了英伟达在其想象管谈中使用AI的情况。

英伟达最奏效的里面器具之一是NVCell，这是一个强化学习方法。每次公司转向新的半导体工艺时，工程师必须移植多达3000个单位的范例单位库。

"曩昔需要8东谈主团队耗尽约10个月，"Dally说。"咱们确立了一个基于强化学习的方法，驱散本色上比东谈主类想象更好。"

除了物理芯片布局，英伟达还部署了一个名为ChipNeMo的定制大言语模子来提高工程分娩力。

ChipNeMo在英伟达独到硬件想象文档上老师，行为低级工程师的导师，浅显了资深想象师解释特定芯片组件基本功能的时候。它还不错总结误差回报并自动将其路由到稳当的想象师进行管制。

Dally但愿AI最终简略自动化芯片确立中最耗时的部分。"我很但愿简略简短地说，'给我想象一个新的GPU'，然后我去滑雪几天，总结时就完成了，"他说，尽管他承认距离阿谁推行还很远方。

即使那一天到来，Dally预期AI芯片想象师也会依赖一个主智能体来编排尽头的子智能体，这些智能体相互协商来详情架构，复制东谈主类工程师今天举行的会议。

Q&A

Q1：为什么传统软件器具无法适合AI智能体的使命速率？

A：因为AI智能体启动速率远超东谈主类，而传统器具如编译器、分娩力专揽方法的启动时候和反应蔓延对东谈主类来说不是问题，但会在智能体高速操作时形成雄伟的性能瓶颈。因此需要根人道再行想象来匹配机器速率。

Q2：AI模子奈何已毕自主研发能力？

A：通过神经架构搜索工夫，模子不错用当然言语指定臆想空间，自动进行实验、整理数据并老师下一版块。模子需要打破传统老师罢休，在环境中罗致行动或预测谜底后再回到学习状况，显赫提高学习后果。

Q3：英伟达奈何管制AI狡计中的能耗问题？

A：主要计谋是"不要移动数据"开yun体育网，因为数据移动消耗的能量是狡计自己的1000倍。英伟达通过3D堆叠工夫将内存成功堆叠在GPU之上，减少数据移动距离，同期探索稀薄性工夫跳过不过失的狡计来降稚童耗。

开yun体育网＂它会去实行这些实验-开云官网登录入口 开云app官网入口