智东西
作家 | 骏达 程茜
裁剪 | 心缘
全球最大云磋议巨头的AI兵器库,又迎来重磅更新!
智东西拉斯维加斯12月2日报说念,本日,在年度云磋议产业嘉会AWS re:Invent上,亚马逊云科技(AWS)连甩一系列重磅AI新品,包括最新AI芯片Trainium4、基于其首款3nm AI芯片的Amazon EC2 Trainium3 UltraServers、第二代自研大模子Amazon Nova 2系列,以及多数Agent开发利器。
从AI基础设施、AI推理平台、企业数据管束到智能体开发器用、前沿智能体,通通迎来一大波升级。智东西行为受邀现场参会的媒体,从大会前排带来超全干货报说念。
Amazon Nova 2系列首发4款模子:经济高效推理模子Lite,高智能推理模子Pro,语音转语音的及时拟东说念主对话式AI模子Sonic,以及面向多模态推理和图像生成的息争模子Omni。
其中,Nova 2.0 Pro Preview在指示奴隶、智能体器用使用榜单中,性能跳跃了GPT-5 mini、GPT-5.1、Claude Opus 4.5、Gemini 3 Pro Preview等前沿模子。
值得一提的是,Amazon Bedrock新增18款全托管开源模子,其中包括4款国内顶尖模子:阿里Qwen3-NEXT和Qwen3-VL、月之暗面Kimi K2 Thinking、稀宇科技MiniMax M2。
其他新增的前沿模子还有谷歌Gemma 3、英伟达Nemotron、OpenAI gpt-oss-safeguard、Mistral AI的Mistral Large 3和Ministral 3等。
总体来看,本日十猛盘曲发布包括:
1、P6e新实例:选拔英伟达GB300 NVL72系统。
2、AWS AI Factories作事:专用客户定制AI基础设施,由AWS快速构建和管束。
3、AWS Trainium4自研AI芯片:第四代自研AI芯片,比拟上一代带来6倍的磋议性能(FP4)、3倍的FP8性能、4倍的内存带宽、2倍的内存容量,并可通过NVLink Fusion和UALink终了纵向延伸。
4、Amazon EC2 Trainium3 UltraServers:由AWS首款3nm AI芯片Trainium3提供支握,提供大限度AI熟识和推理的高性价比,单集群可联接144张Trainium3芯片,算力达362PFLOPS(FP8),带宽为706TB/s,相较上一代带来4.4倍磋议性能、3.9倍高内存带宽、5倍的每百万瓦token数。
5、Amazon Bedrock平台:新增18款开源模子,模子数目畴前一年翻倍增长,已领有跳跃10万客户,其中50多家客户均使用了跳跃1万亿个token。
6、Amazon Nova 2系列自研模子:包括Lite、Pro、Sonic、Omni。
7、Amazon Nova Forge作事:支握企业走访Nova模子在不同阶段的熟识检查点,并将自稀有据与亚马逊的熟识数据集混杂,构建定制前沿模子。
8、AgentCore开发器用:Policy in AgentCore(预览版),使用细粒度权限策略,给agent行动缔造明确鸿沟;AgentCore Evaluations(预览版),使用评估器,字据现实寰宇活动来握续检查agent质料。
9、4款前沿智能体:AWS Transform Custom(专为企业开发使命经过想象),Kiro autonomous agent(自主开发复杂编程任务)、AWS Security Agent(预览版,保护全开发人命周期安全)、AWS DevOps Agent(预览版,加速事件反映速率并提高系统可靠性)。
10、7款新实例、6项Amazon S3存储升级、5项Amazon RDS数据库更新、3项磋议与加速优化新功能、4项管束与治理新功能。
一、新基建:全新AI芯片Trainium4性能飙6倍,帮企业定制专属AI基础设施加曼称,亚马逊云科技是第一家在云中提供英伟达GPU的公司,其与英伟达配合已跳跃15年,亦然迄今为止运行GPU集群最多的公司。
1、基于英伟达GB300 NVL72打造P6e-GB300
今天,亚马逊云科技新发布选拔英伟达最新的GB300 NVL72系统的P6e-GB300,比拟P6e-GB200,新实例GPU内存容量普及至1.5倍,FP4磋议性能(无稀少)普及至1.5倍。
英伟达在亚马逊云科技上运行其生成式AI集群。OpenAI也在亚马逊云科技上基于EC2 Ultra Servers集群撑握ChatGPT运行及熟识下一个模子,部署了数十万张GB200。加曼炫耀这些处理器很快将会变为GB300。
本月初,亚马逊云科技还与沙特阿拉伯AI创企Humain建立了配合资伴相关,策动在沙特的数据中心设施中提供、部署和管束至多15万个AI加速器。
2、AWS AI Factories厉害企业非凡化部署需求
为厉害企业的非凡化部署需求,今天亚马逊云科技告示推出AWS AI Factories。基于这一平台,客户能在我方的数据中心部署专用AI基础设施,然后使用亚马逊云科技的基础设施和作事。
3、Amazon EC2 Trainium3 UltraServers
现在,Amazon Bedrock上运行的总计推理器用都由Trainium提供支握,亚马逊云科技照旧部署了100万颗Trainium芯片,Trainium2的量产速率是其也曾芯片量产速率的4倍。
加曼称,亚马逊云科技的Trainium系列芯片诚然以“熟识”定名,但这些芯片其实也适用于推理用途。现在,亚马逊云科技上的很多AI推理作事都是在Trainium芯片上运行的,包括Claude的前沿模子。
亚马逊云科技还围绕Trainium打造了一个超大限度系统,名为Project Rainier,用于Anthropic下一代Claude模子的熟识。
这一容貌的限度相等繁密,加曼称,若是畴前寰球常说单个数据中心照旧成了新的磋议机,Project Rainier则更进一步,让由多个数据中心组成的园区,组成了一个磋议机。
Project Rainier将会不停扩大限度,最终支握高达30个单体数据中心,用掉1.1GW的电力,托管跳跃50万个Trainium2芯片。臆想磋议开荒会使用跳跃100万个的高速联接器件,通过AWS EFA网络终了安全、可靠的联接。
亚马逊云科技于旧年发布了Trainium3芯片,今天,加曼告示Amazon EC2 Trn3 UltraServers作事器照旧庸碌可用。与上一代产物比拟,该作事器可提供4.4倍的算力和3.9倍的内存带宽。
值得提神的是,Amazon EC2 Trn3 UltraSevers在能效比上也有普及,每兆瓦所处理的token数目达前代产物的5倍。
4、下一代AI芯片Trainium 4
加曼还炫耀,亚马逊云科技的下一代AI芯片Trainium 4已深化想象阶段。Trainium4瞻望能提供6倍的FP4性能,4倍的内存带宽,2倍的内存容量,并支握通过NVLink Fusion和UALink进行延伸。
亚马逊云科技Amazon Bedrock推理平台照旧领有跳跃10万客户,使用其处理超1万亿个token的企业客户已跳跃50家。
亚马逊云科技一直以来的信条就是“弃取至关盘曲(Choice Matters)”,这也适用于模子的弃取。加曼称,亚马逊云科技以为AI的改日不会仅由1个模子统治,畴前1年,Amazon Bedrock上提供的模子数目照旧翻倍,DeepSeek、Qwen等中国模子也在支握范围之内。
Amazon Bedrock还在今天新增了18款全托管开源模子,包括Qwen3-Next-80B-A3B、Qwen3-VL-235B-A22B、Kimi K2 Thinking、MiniMax M2等中国模子。此外,谷歌Gemma、英伟达Nemotron以及全新的Mistral Large 3和Ministral 3(3B、8B和14B版块)等模子也登陆Amazon Bedrock平台。
亚马逊云科技还发布第二代自研模子家眷Nova 2系列,推出了4款新模子:Lite、Pro、Sonic和Omni。
Nova 2 Lite是一款快速且经济高效的推理模子,适用于各式类型的使命负载,领有可以的指示除名、器用调用、信息索求、代码生成等才智。Nova 2 Lite在上述四大领域的才智基本全面突出了Claude Haiku 4.5、GPT-5 mini、Gemini 2.5 Flash等轻量级模子,仅在编程才智上略逊于GPT-5 mini。
Nova 2 Pro是Nova系列中最智能的推理模子,支握笔墨、图像、视频、语音四种模态输入和文本模态输出,适用于高度复杂的使命负载,尤其是Agent场景。在两项Agent基准测试中,其发达照旧跳跃了GPT-5.1(high)、Gemini 3 Pro Preview(high)等前沿模子。
Nova 2 Sonic则是亚马逊云科技的下一代语音转语音模子,支握文本和语音两个模态的输入输出,能为AI应用提供及时、类东说念主的对话式AI体验。在语音结合和推理任务上,其性能照旧跳跃了GPT Realtime、Gemini 2.5 Flash等。
Nova 2 Omni是Nova系列的新物种,亦然业界首个支握文本、图像、视频和音频输入,并支握文本和图像生成输出的推理模子。不外,亚马逊云科技尚未公布其基准测试得益。
加曼谈说念,AI需要领有结合公司数据的才智,才能着实为公司和客户带来巨大价值。
由于数据具有非凡色,企业频频不但愿我方的专稀有据被镶嵌到第三方模子中,供他东说念主使用。畴前,业内让企业数据和模子结合最常用的技艺是RAG或向量数据库,但这无法让模子着实结合数据。念念要教化模子结合行业学问,照旧需要定制模子。
但是,若是从零初始定制模子是极为腾贵的,企业莫得满盈数据、满盈算力打造出刚劲的通用智能。
若是在开源模子的基础上,通过微调、强化学习等姿色打造行业模子,则有可能出现其他领域性能下落的风险。
亚马逊云科技的处理有策动,是Amazon Nova Forge。Nova Forge引入了“怒放式熟识模子(Open Training Model)”的成见。
通过Nova Forge,企业可以独家走访各式Nova模子的熟识检查点,并在模子熟识的汗漫阶段,将我方的专稀有据与亚马逊创建的熟识数据集混杂。这使得企业偶然产出一个深度结合企业信息的模子,同期不会渐忘模子已熟识的中枢信息。
Nova Forge还提供了使用良友奖励函数和强化学习微调的才智,以进一步校阅模子,让企业可以将着实环境集成到熟识轮回中。由于基础模子已司结合业务,这些后熟识技艺实践上会变得愈加灵验。
亚马逊云科技照旧和不少企业试点了Nova Forge作事。索尼便通过Nova Forge,对Nova 2 Lite模子进行了微调,使其适用于索尼本人的业务和运营。模子在援用一致性和文档依据等任务上发达优于基准模子,索尼的处所是借此将索尼合规审查和评估经过的成果普及100倍。
今天,亚马逊云科技告示Amazon Bedrock AgentCore新增两项新功能,匡助开发者快速构建Agent。自AgentCore SDK预览版发布以来,其在5个月内下载量已跳跃200万次。
此前,亚马逊推出了为Agent想象的中枢器用集AgentCore,包含部署、代码解说器、托管环境等诸多才智。在此基础上,亚马逊推出Policy in AgentCore预览版和AgentCore Evaluation预览版。
Policy in AgentCore允许开发者在AgentCore Gateway器用调用运行前阻扰,使用带有细粒度权限的策略,为Agent活动界诠释确的界限,如使用哪些器用、奈何使用器用,开发者也可以通过当然话语创建程序,如“报销金额大于1000好意思元时,就贫穷退款”等。
AgentCore Evaluation是一项全托管作事,匡助开发者握续监控和分析基于着实活动的Agent发达。开发者可以使用内置评估器来量度常见的质料维度,如正确性、匡助性、器用弃取准确性、安全性、处所到手率和高下文臆想性,还可以创建基于模子的定制评分系统,字据我方弃取的请示和模子进行业务定制评分。
总计AgentCore的评估放纵都会在亚马逊息争监控平台CloudWatch被呈现。开发者还可以缔造评估分数的警报和警报,主动监控Agent质料,并在目标超出可汲取阈值时作出反映。
亚马逊此前构建了Amazon Quick和Amazon Connect两个Agent有策动。
率先是Amazon Quick,可以匡助职工在几分钟内将不雅点转机成行动,辅导深度接洽和赢得详备分析,其会从获取信息整理出贯注的接洽证明;职工还可以创建微型Agent,匡助我方处理浩繁重迭性使命。几周前,亚马逊在公司里面发布了Amazon Quick,现在其已领稀有十万用户。
其次是Amazon Connect,加曼谈到在亚马逊里面税务团队中的一个案例,该团队创建了一个Agent,匡助其汇注总计税务数据着手、深化接洽税法计策变化。该Agent的另一个应用场景是客户作事,可以将AI引入企业的连络中心。Amazon Connect业务的年度常常性收入照旧跳跃10亿好意思元。
五、新Agent:加速开发、优化编程、保护安全、增强可靠加曼以为,关于试图快速当代化其应用措施的开发团队来说,现在最大的痛点之一就是处理技艺债。在好意思国,技艺债务每年给企业形成共计2.4万亿好意思元的耗损,如今70%的IT预算都被用于爱戴留传系统。
此前,亚马逊云科技照旧推出了AWS Transform,通过AI终了转机经过的降本增效。在此基础上,AWS本日推出了AWS Transform Custom,这一智能体匡助用户创建自界说代码转机智能体,以终了任何代码、API、框架、运行时或编程话语的翻译和当代化。
举例,全球著明ERP软件公司QAD等于用AWS Transform,将底本需要至少需要两周才能完成转机的容貌,压缩至3天。
本年早些时候,亚马逊云科技发布了面向专科开发者的AI IDE “Kiro”。加曼称,照旧稀有十万开发者在使用Kiro,有开发者惊奇,用了Kiro之后,我方在畴前5个月内录用的代码,比畴前10年还要多。上周,亚马逊照旧把Kiro定为该公司的官方AI开发环境。
为了进一步加强开发经过的自动化进程,亚马逊云科技发布了全新的三个前沿智能体,让Kiro在自主性、大限度可延伸和恒久运行等领域的发达进一步增强。
Kiro Autonomous Agent是一个与开发使命流并交运行的自主开发智能体。它就像团队的一限非常成员,能孤独处理复杂任务,让工程师专注于中枢创意。开发者只需指派一个复杂的、处所导向的任务,它能自行策画、理会并实行总计必要设施,直到录用可用代码。
这一Agent还会越用越智慧,能恒久、深度地结合代码库、团队表率和过往决策,从每一次互动中学习,形成“集体顾忌”,并应用所学学问到后续任务中。
AWS Security Agent则是一个握续、主动、内置的AI安全大师。它能在想象阶段主动审查文档,确保安全性;在编程过程中扫描代码症结,并平直集成到GitHub PR中,为开发者提供即时、可操作的开发刻薄。
这一Agent还可以将浸透测试自动化,将传统的、腾贵且周期长的浸透测试,激荡为可按需启动、快速完成的自动化、握续考证过程。
AWS DevOps Agent则将运维使命自动化,能自动会诊并开发问题。当警报触发时,DevOps Agent会立即自动反映,会诊问题的根蒂原因,提供修改意见和修改有策动,并交由工程师审查和批准。
六、新实例、新存储、新数据库、新加速、管束与治理加曼临了用10分钟公布了25个新发布。
7款新实例:搭载第五代AMD EPYC处理器的X8i Instances,内存增多超50%;搭载第五代AMD EPYC处理器的X8aedz Instances,磋议性能是前一代X2iezn实例的两倍;搭载第五代AMD EPYC处理器的C8a Instances,性能普及30%,性价比普及19%;搭载英特尔至强6的C8ine Instances,实例树立每个vCPU的数据包性能可比上一代C6in实例普及2.5倍;搭载第五代AMD EPYC处理器的M8azn Instances,磋议性能是上一代M5zn实例的2倍。
还有两款选拔最新苹果硬件的新实例:EC2 M3 Ultra Mac Instances、EC2 M4 Max Mac Instances。
面向开发者,亚马逊云科技推出Lambda durable functions(握久函数),开发者可以期骗内置的自动规复功能构建恒久运行的使命负载。
存储方面,包括将S3最大对象大小从5TB提高到50TB,增多10倍;亚马逊S3的数据管束功能S3 Batch Operations更新,在200亿个对象的限度下,完成效课的速率普及10倍;为S3 Tables提供智能分层,节俭80%存储老本;S3 Tables支握AWS区域和账户间自动复制;延伸Amazon S3接入点,支握Amazon FSx for NetApp ONTAP;用于存储和查询向量的对象存储S3 Vectors全面上市;期骗GPU普及向量索引构建成果,速率普及10倍,仅需1/4老本。
磋议与加速优化新功能,Amazon EMR Serverless提供Amazon EMR on EKS,允许用户在不事先树立或管束存储的情况下运行大数据使命负载。
Amazon RDS数据库的更新包括:RDS for Oracle和RDS for SQL Server延伸存储容量、RDS for SQL Server的CPU优化选项、对SQL Server开发者版块的支握,以及数据库节俭策动。
管束与治理臆想的新发布包括:为ECS和EC2新增GuardDuty延伸胁迫检测功能、提供近乎及时刻析及风险优先级排序功能的Security Hub安全中心、CloudWatch息争数据管束和分析功能。
结语:Agent开发已成加速更变的势在必行在主题演讲中,加曼屡次强调了Agent的盘曲性:Agent是企业从AI投资中看到本体性交易酬劳的地方。而为Agent系统、应用开发构建新的模块,需要性能更强的AI基础设施、推理平台、企业数据、构建和部署Agent的器用。
Agent可自主感知业务需求并依据需求智能适配业务经过、动态调养实行策略,高效匹配业务场景的中枢诉求,其照旧成为开释AI价值的盘曲载体。亚马逊云科技在延伸加速磋议产物线的同期,亦在不停优化Agent开发和部署器用,推出厉害开发者多元化使命负载需求的新平台、新器用。
据加曼转头,本年第三财季,亚马逊云科技的年化收入照旧达到1320亿好意思元,同比增长超20%。
畴前一年,亚马逊云科技增多了3.8GW数据中心容量。如今,亚马逊云科技领有全球限度最大、部署最庸碌的AI云基础设施,全球数据中心网络笼罩38个地区、120个可用性区域,还告示再增多3个地区。
亚马逊云科技照旧与全球顶尖的大模子公司建立配合开yun体育网,在其平台陆续上架全球主流开源模子,下一步的要点,昭彰照旧是奈何匡助更多客户将Agent落地到着实业务中,产生更庸碌的交易价值。