小米公司在之前并未公开说明要开发大语言模型,近日发现在小米官方的github账号中出现了MiLM-6B 的AI大模型的简介!

MiLM-6B 是由小米开发的一个大规模预训练语言模型,参数规模为64亿。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。

 

MiLM-6B

在 C-Eval 中文语言模型评测系统中小米MiLM-6B  模型测试排名为总榜第九名。MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度,不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中,还有一定进步空间。

MiLM-6B

数据统计

相关导航

暂无评论

暂无评论...