AMD推出锐龙AI Halo迷你主机：128G统一内存，本地跑200B大模型

信息来源: X2026-06-16 00:50

产品发布/更新 AI迷你主机 AMD锐龙AI Halo 本地大模型

看点：128G大统一内存塞进迷你主机，让本地跑200B大模型成为现实，比DGX Spark更便宜且支持Windows，是本地AI算力的新选择。

AMD正式上架了旗下首款第一方AI开发者迷你主机——锐龙AI Halo。这款主机体积仅为149×149×43mm，重约1.2kg，和Mac mini差不多大，但把128GB LPDDR5X-8000统一内存塞进了这个小机身里，起售价3999美元（约合2.7万元人民币）。

硬件核心是锐龙AI Max+ 395处理器，基于Zen 5架构，16核32线程，集成Radeon 8060S核显与50 TOPS算力的XDNA 2 NPU。CPU、GPU与NPU共享这128GB统一内存池，无需跨芯片搬运数据，官方宣称无需联网即可在本地运行最高2000亿参数的大模型，比如GPT-OSS 120B、Qwen 3.5 122B等。

接口方面给得很足，配备Wi-Fi 7、蓝牙5.4、10GbE有线网口、4个USB-C口（其中一个用于供电）以及一个HDMI 2.1b输出。软件生态上，提供Win11专业版与Linux双系统选择，完整支持ROCm 7.2.2套件，已针对PyTorch、vLLM、llama.cpp、ComfyUI、LM Studio等主流框架优化，开箱即用，宣称从开机到出token只需几分钟。

对比竞品，它比英伟达DGX Spark（定价4679美元且仅支持Linux）便宜且系统兼容性更好，官方数据显示在GLM 4.7等模型上推理速度也更快。对比Mac Mini M4 Pro，在部分AI任务中性能可达3至7倍，且能跑参数量大得多的模型。

不过，2.7万元人民币的起步价并不便宜，它更偏向专业AI开发者或重度创作者的本地算力节点。另外，AMD已预告将在2026年Q3推出升级版，搭载锐龙AI Max+ PRO 495，统一内存提升至192GB，届时可本地运行3000亿参数模型，如果不急也可以再观望。

怎么用

适合需要在本地断网运行百亿参数级大模型的AI开发者和重度创作者。
提供Win11专业版与Linux双系统，预置ROCm、PyTorch、vLLM等环境，开箱即用。
起售价3999美元（约2.7万人民币），属于专业级设备，普通轻度用户门槛较高。

图片来源：x.com

返回快讯目录查看原文

图钉AI导航致力于优质、实用的网络站点资源收集与分享！本文地址https://www.tudingai.com/ainews/5000.html转载请注明

相关快讯

Google发布Gemini 3.5 Live Translate：70+语言边听边译，保留原声音调

新Google发布Gemini 3.5 Live Translate：70+语言边听边译，保留原声音调

Google发布实时语音互译模型Gemini 3.5 Live Translate。该模型支持70多种语言流式边听边译，延迟仅数秒，并能保留说话人语调与音高。它具备自动语言检测和抗噪能力，无需等说完再翻。普通用户可通过Google翻译App...

X

2026-06-11

Anthropic 发布 Claude Fable 5：Mythos 级模型首次公开

新Anthropic 发布 Claude Fable 5：Mythos 级模型首次公开

Anthropic 正式推出 Claude Fable 5，这是此前备受关注的 Mythos 网络安全大模型的公开版。官方称其能力超越以往任何公开模型，擅长长周期复杂任务。为确保通用安全，公开版加入了严格防护，网络操作权限低于专供版，防止滥...

X

2026-06-10

月之暗面 Kimi Work Beta 版内测：本地 Agent 支持 300 子 Agent 协作

月之暗面 Kimi Work Beta 版内测：本地 Agent 支持 300 子 Agent 协作

月之暗面宣布 Kimi Work Beta 版开启内测，这是一款面向知识工作者的通用型本地 Agent。它以 Kimi Code 为内核，内置浏览器方案和专业数据库，用户只需自然语言描述目标，即可自动拆解任务、调用工具并交付文档。其最大亮点...

ithome.com

2026-06-04

英伟达发布 RTX Spark 处理器，1 PFLOP 算力杀入 Arm 架构 AI PC

英伟达发布 RTX Spark 处理器，1 PFLOP 算力杀入 Arm 架构 AI PC

英伟达在 COMPUTEX 2026 推出 RTX Spark 超级芯片，集成 20 核 Grace CPU 与 Blackwell RTX GPU，AI 算力达 1 PFLOP，配 128GB 统一内存。它主打 Windows on Ar...

X

2026-06-02

最新版 Codex 可以看到 Token 用量了

最新版 Codex 可以看到 Token 用量了

将Codex更新至组新版 V 26.527.31326 可以查看Token的具体用量，之前跟黑盒一样。查看方法：codex > 设置 > 个人资料

2026-05-30

Anthropic 发布 Claude Opus 4.8：更诚实，支持数百子智能体并行

Anthropic 发布 Claude Opus 4.8：更诚实，支持数百子智能体并行

Anthropic 发布旗舰模型 Claude Opus 4.8，主打“诚实性”提升，代码缺陷漏报率较前代降四倍，不确定时更愿承认而非硬编。Agent能力增强，新增动态工作流可调度数百子智能体并行。定价不变，新增提速2.5倍的Fast Mo...

X

2026-05-30

Qwen3.7-Max上线隐式缓存，API调用自动提速降价

阿里云旗舰模型Qwen3.7-Max正式上线隐式缓存功能，无需任何配置即可自动生效，直接提升响应速度并降低调用成本。若对缓存命中率有更高要求，可切换至显式缓存模式。开发者可通过百炼平台调用该模型API。

X：通义千问 / Qwen (@Alibaba_Qwen)

2026-05-26

OpenClaw 2026.5.22发布：/models响应降至5ms，安全加固

开源本地AI智能体框架OpenClaw发布2026.5.22版本。本次更新重点在于性能与安全：Gateway与模型启动路径精简，/models接口响应时间大幅降至约5毫秒；npm包新增锁定依赖项，Windows安装与更新路径也得到安全强化...

X：OpenClaw (@openclaw)

2026-05-24

暂无评论

none

暂无评论...