AMD推出锐龙AI Halo迷你主机:128G统一内存,本地跑200B大模型
AMD正式上架了旗下首款第一方AI开发者迷你主机——锐龙AI Halo。这款主机体积仅为149×149×43mm,重约1.2kg,和Mac mini差不多大,但把128GB LPDDR5X-8000统一内存塞进了这个小机身里,起售价3999美元(约合2.7万元人民币)。
硬件核心是锐龙AI Max+ 395处理器,基于Zen 5架构,16核32线程,集成Radeon 8060S核显与50 TOPS算力的XDNA 2 NPU。CPU、GPU与NPU共享这128GB统一内存池,无需跨芯片搬运数据,官方宣称无需联网即可在本地运行最高2000亿参数的大模型,比如GPT-OSS 120B、Qwen 3.5 122B等。

接口方面给得很足,配备Wi-Fi 7、蓝牙5.4、10GbE有线网口、4个USB-C口(其中一个用于供电)以及一个HDMI 2.1b输出。软件生态上,提供Win11专业版与Linux双系统选择,完整支持ROCm 7.2.2套件,已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架优化,开箱即用,宣称从开机到出token只需几分钟。
对比竞品,它比英伟达DGX Spark(定价4679美元且仅支持Linux)便宜且系统兼容性更好,官方数据显示在GLM 4.7等模型上推理速度也更快。对比Mac Mini M4 Pro,在部分AI任务中性能可达3至7倍,且能跑参数量大得多的模型。

不过,2.7万元人民币的起步价并不便宜,它更偏向专业AI开发者或重度创作者的本地算力节点。另外,AMD已预告将在2026年Q3推出升级版,搭载锐龙AI Max+ PRO 495,统一内存提升至192GB,届时可本地运行3000亿参数模型,如果不急也可以再观望。

怎么用
- 适合需要在本地断网运行百亿参数级大模型的AI开发者和重度创作者。
- 提供Win11专业版与Linux双系统,预置ROCm、PyTorch、vLLM等环境,开箱即用。
- 起售价3999美元(约2.7万人民币),属于专业级设备,普通轻度用户门槛较高。
图片来源:x.com











