AMD推出锐龙AI Halo迷你主机:128G统一内存,本地跑200B大模型

信息来源: X
看点:128G大统一内存塞进迷你主机,让本地跑200B大模型成为现实,比DGX Spark更便宜且支持Windows,是本地AI算力的新选择。

AMD正式上架了旗下首款第一方AI开发者迷你主机——锐龙AI Halo。这款主机体积仅为149×149×43mm,重约1.2kg,和Mac mini差不多大,但把128GB LPDDR5X-8000统一内存塞进了这个小机身里,起售价3999美元(约合2.7万元人民币)。

硬件核心是锐龙AI Max+ 395处理器,基于Zen 5架构,16核32线程,集成Radeon 8060S核显与50 TOPS算力的XDNA 2 NPU。CPU、GPU与NPU共享这128GB统一内存池,无需跨芯片搬运数据,官方宣称无需联网即可在本地运行最高2000亿参数的大模型,比如GPT-OSS 120B、Qwen 3.5 122B等。

接口方面给得很足,配备Wi-Fi 7、蓝牙5.4、10GbE有线网口、4个USB-C口(其中一个用于供电)以及一个HDMI 2.1b输出。软件生态上,提供Win11专业版与Linux双系统选择,完整支持ROCm 7.2.2套件,已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架优化,开箱即用,宣称从开机到出token只需几分钟。

对比竞品,它比英伟达DGX Spark(定价4679美元且仅支持Linux)便宜且系统兼容性更好,官方数据显示在GLM 4.7等模型上推理速度也更快。对比Mac Mini M4 Pro,在部分AI任务中性能可达3至7倍,且能跑参数量大得多的模型。

不过,2.7万元人民币的起步价并不便宜,它更偏向专业AI开发者或重度创作者的本地算力节点。另外,AMD已预告将在2026年Q3推出升级版,搭载锐龙AI Max+ PRO 495,统一内存提升至192GB,届时可本地运行3000亿参数模型,如果不急也可以再观望。

怎么用

  • 适合需要在本地断网运行百亿参数级大模型的AI开发者和重度创作者。
  • 提供Win11专业版与Linux双系统,预置ROCm、PyTorch、vLLM等环境,开箱即用。
  • 起售价3999美元(约2.7万人民币),属于专业级设备,普通轻度用户门槛较高。

图片来源:x.com

相关快讯

Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 发布 Claude Fable 5:Mythos 级模型首次公开

Anthropic 正式推出 Claude Fable 5,这是此前备受关注的 Mythos 网络安全大模型的公开版。官方称其能力超越以往任何公开模型,擅长长周期复杂任务。为确保通用安全,公开版加入了严格防护,网络操作权限低于专供版,防止滥...
X
2026-06-10

Qwen3.7-Max上线隐式缓存,API调用自动提速降价

阿里云旗舰模型Qwen3.7-Max正式上线隐式缓存功能,无需任何配置即可自动生效,直接提升响应速度并降低调用成本。若对缓存命中率有更高要求,可切换至显式缓存模式。开发者可通过百炼平台调用该模型API。
X:通义千问 / Qwen (@Alibaba_Qwen)
2026-05-26

OpenClaw 2026.5.22发布:/models响应降至5ms,安全加固

开源本地AI智能体框架OpenClaw发布2026.5.22版本。本次更新重点在于性能与安全:Gateway与模型启动路径精简,/models接口响应时间大幅降至约5毫秒;npm包新增锁定依赖项,Windows安装与更新路径也得到安全强化...
X:OpenClaw (@openclaw)
2026-05-24

暂无评论

none
暂无评论...