北京——2025年4月7亚马逊云科技日前宣布,Meta的新一代Llama 4模型现已在AmazonSageMaker JumpStart上正式可用,完全托管的无服务器版本也将很快在AmazonBedrock推出。首批推出的Llama 4 Scout17B与Llama 4 Maverick 17B均具备先进的多模态能力(可同时理解图像与文本),并拥有行业领先的上下文窗口长度(单次处理信息量),性能与效率较前代显著提升。此外,Llama 4模型采用智能计算策略,根据具体任务智能选择激活其“专家”模块,而非全程调用全部算力,从而能以更低算力实现更优效果,降低企业使用先进AI技术的使用门槛与成本。

亚马逊云科技推出Llama 4 Scout与Llama 4 Maverick,进一步丰富了客户在亚马逊云科技上构建、部署和扩展应用程序时的模型选择。亚马逊云科技始终通过与如Meta等领先的AI公司紧密合作,确保客户能在第一时间使用最新模型,并借助企业级的工具与安全保障更轻松地构建、定制和扩展其生成式AI应用。

亚马逊云科技此次通过引入Meta两款全新的多模态模型,进一步强化了其对模型多样化的承诺。Llama 4 Scout 17B大幅扩展了AI单次处理能力——其上下文长度从早期Llama模型的12.8万token跃升至1,000万token(约提升80倍)。这一升级可支持多文档总结、复杂用户行为分析或整段代码库推理等场景。Llama 4 Maverick 17B是通用型模型,擅长12种语言的图文理解任务,尤其适用于开发复杂的智能助手与聊天应用程序。

两款Llama 4模型均采用原生多模态设计,即从设计之初就能无缝的同时理解文本与图像,而非将两者作为独立的输入进行处理。这是Meta首次采用高效的专家混合(MoE)架构,该架构仅针对每项任务激活模型中最相关的模块,能够帮助客户显著提升模型的训练与推理的计算效率,进而以更低的成本获得更出色的性能。

Llama 4 Scout 17B与Llama 4 Maverick 17B介绍

若将Llama 4模型拟人化,Scout就像一位注重细节的研究助理,拥有“过目不忘”的能力。假若身处大型图书馆中,它能够仅凭一张小小的书桌,瞬间能从数千份文档里精准调取所需信息。Scout能预判信息需求,不仅提供答案,还会赋予答案有意义的上下文。Maverick则像一位精通多语言的创意总监,擅长视觉叙事,无论是起草引人入胜的故事、精准分析复杂图像,还是在客户会议中用多种语言保持品牌声调,均能游刃有余。

数据解析

● 据Meta称,Llama 4 Scout 17B包含170亿活跃参数与1,090亿总参数,其性能在同类别模型中处于领先水平。

● Llama 4 Scout 17B还拥有行业领先的1,000万token上下文窗口——约为Llama 3的12.8万token的80倍。这相当于从一次性吸收几页书的信息跃升至整部百科全书。

● Llama 4 Maverick 17B包含170亿活跃参数与4,000亿总参数,分布于128个专家模块中。这如同拥有128台协同工作的专用机器,但仅按任务激活最相关的部分,兼具强大性能与效率。

模型的专家混合(MoE)架构就像拥有一支专家团队,而非一名通才。模型不会为每个问题调用全部算力,而是根据具体任务智能选择激活其“专家”模块。这类似于医院将患者分诊至不同专科医生,而非让每位医生尝试治疗所有病症。这种更具针对性的方式使Llama 4能以更少计算资源实现更强大的结果,让各类规模的企业都能更便捷、经济地使用先进AI技术。对开发者而言,这意味着他们能够构建复杂的应用程序,这些程序可以处理海量信息,同时支持多种语言,并能无缝处理文本和图像。

亚马逊云科技始终致力于为客户及时提供领先AI公司最新模型,随着模型在规模与模态上的持续扩展,这将赋能客户充分释放生成式AI的潜力。此外,亚马逊云科技很快还将在AmazonBedrock中推出完全托管的无服务器版本的Llama 4模型。

欲即刻使用Llama 4,请访问AmazonSageMaker AI控制台。

关注中国IDC圈官方微信:idc-quan 我们将定期推送IDC产业最新资讯

查看心情排 行你看到此篇文章的感受是:


  • 支持

  • 高兴

  • 震惊

  • 愤怒

  • 无聊

  • 无奈

  • 谎言

  • 枪稿

  • 不解

  • 标题党
2025-02-13 18:25:33
市场情报 业内首个!360亿方智能发布《航空AI白皮书》
AI作为一项技术能力,只有与航空行业的实际场景相融合才能碰撞出经济价值,其中最受关注的便是航空收益管理。 <详情>
2024-12-18 11:17:29
Iaas IDC报告:边缘转型持续加速,Akamai稳居边缘交付领导地位
IDCMarketScape 指出:边缘正在转变为全球电子商务的新中心、富媒体客户体验的中心和物联网内容交付的中心。 <详情>
2024-12-11 15:00:57
云资讯 从全球布局到持续创新 Akamai如何获得中企出海的青睐
Akamai未来希望把自己定位为一个‘推理云’,帮助用户更好的在Akamai公有云上做推理。 <详情>
2024-12-09 16:00:50
2024-11-11 15:50:22
市场情报 双11百吋大屏焕新“热”,海信AI画质电视成最大赢家
AI时代与时俱进,海信围绕 “视听越来越真实”、“交互越来越简单”、“运行越来越流畅”、“服务越来越多样”四个维度,首创"一键式AI"。 <详情>
Rambus 通过新一代CryptoManager安全IP解决方案增强数据中心与人工智能保护
2025-04-16 10:55:15
油城算力攀“新峰” 丝路云网架“金桥” ——克拉玛依市算力产业发展纪实
2025-04-15 10:57:00
筑AI生产力底座 酒仙桥论坛丨AIDC创新驱动力新变革专场将于4月16日隆重举行
2025-04-11 18:26:36
26亿!普洛斯中国首支数据中心基金完成募集 AI驱动算力资产升温
2025-04-07 16:10:47
科智咨询:寒冬将尽,春山可望!AI引领中国IDC市场进入新一轮增长周期
2025-04-03 12:04:48
原创|中国智算中心建设“过剩论”的另一面
2025-04-02 11:38:00
AI重塑云基础设施 亚马逊云科技获评IDC全球IaaS评估报告双第一
2025-04-01 19:48:00
中信集团在港成立人工智能科创中心 助力香港发展新质生产力
2025-04-01 19:36:00
普洛斯中国首支数据中心基金完成募集,投资规模约26亿人民币
2025-04-01 18:19:39
投资20亿元、2000P,华池中科超级云智算中心一期项目开工
2025-04-01 14:13:15
“全球重点区域算力产业考察年度行”活动之——走进张家口:把脉算力新高地
2025-04-01 14:11:08
联想AI服务三大品牌首次集中亮相 覆盖三大客群全面抢滩AI服务
2025-03-31 17:51:00
预估1.2亿 中国电信芜湖大数据中心A1楼机电建设招标
2025-03-31 14:06:38
追踪AI算力领域热点产业资讯|《算力产业核心内刊》企业Pro版正式发布!
2025-03-31 14:02:37
方榕出任中兴通讯董事长
2025-03-31 13:50:16