MiLM-6B

9个月前更新 4,498 0 3

小米AI大模型

收录时间：

2023-08-12

小米公司在之前并未公开说明要开发大语言模型，近日发现在小米官方的github账号中出现了MiLM-6B 的AI大模型的简介！

MiLM-6B 是由小米开发的一个大规模预训练语言模型，参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

在 C-Eval 中文语言模型评测系统中小米MiLM-6B 模型测试排名为总榜第九名。MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度，不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中，还有一定进步空间。

数据统计

暂无评论...

图钉AI导航

只分享优质AI工具，与你一起遇见未来！

按 Ctrl+D 可收藏本网页，方便快速打开使用。

浏览器 设置页面 > 启动时 选项下 打开特定网页或一组网页。

363

收录网址

收录软件

188

收录文章

2.1K

运行天数

07-02 01:28快讯
Claude Code 封号原因被曝光！Anthropic植入检测代码标记中国用户。
2026年6月底，Anthropic大规模封禁大量Claude账号（包括付费Claude Max用户），许多
06-30 12:09快讯
DeepSeek V4 正式版计划于 7 月中旬正式上线。高峰期API价格翻倍
昨天收到了DeepSeek 官方的通知邮件，邮件称DeepSeek V4 正式版计划于 7 月中旬正式上线。
06-29 01:57论文研究MarkTechPost（RSS）
DeepSeek 开源 DSpark 投机解码框架，加速 DeepSeek-V4 生成速度 60-85%
DeepSeek 发布 DSpark 投机解码框架并开源检查点与训练代码。该框架不是新模型，而是在 DeepSeek-V4 权重上附加草稿模块，通过半自回归生成（并行骨干 + 轻量
06-27 14:19产品发布/更新
OpenAI 今天发布了 GPT-5.6大模型，但是普通人用不了。
GPT-5.6 发了，很强，但你用不上。目前只给 20 家美国政府点头的合作伙伴。OpenAI 自己都说这不应该是常态。AI 正在从“技术问题”变成“国家安全问题”——这句话值得细品。
06-25 04:31产品发布/更新mp.weixin.qq.com
QQ邮箱推出AI专属版，腾讯全面AI化
用独立邮箱解决Agent接管主邮箱的隐私痛点，让AI自动化处理邮件变得更安全可行。