dots.llm1:小红书Hi Lab发布的首个开源大模型最新ai

小红书于2025年6月7日开放其首个大模型dots.llm1,是小红书Hi Lab(人文智能实验室)自主研发的,dots.llm1是一个1420亿参数的专家混合模型(MoE),通过推理时只激活140亿参数,保持高性能的同时,大大降低了训练和推理成本。下一个豆包

dots.llm1:小红书Hi Lab发布的首个开源大模型.webp

模型特色grok4.1

  • 使用大规模自然训练数据:使用11.2万亿token非合成高质量训练数据,在现阶段的开源大模型中非常少见,这使得它在中文测试中有强大的性能,以91.3的平均分超过了DeepSeek开源的V2、V3和阿里开源的Qwen2.5 32B和72B。 扣子coze下载

  • 架构设计:使用单向解码器Transformer架构,但将前馈网络替换成MoE。在推理时不激活全部专家网络,而是根据输入标记的性质动态选择激活一小部分专家网络做计算,这种稀疏激活的方式极大降低了算力需求的同时保证了模型高性能。dots.llm1的MoE由128个路由专家和2个共享专家组成,每个专家网络是一个两层的前馈网络,使用SwiGLU激活函数。在每个输入标记的处理上会通过一个路由机制选择6个最相关的专家网络,加上2个共享专家,总共激活8个专家网络。 密鸽(al)

  • 注意力层优化:使用经典的多头注意力机制(MHA),且在其基础上添加了RMSNorm归一化操作,避免了输入值过大或过小对模型训练的影响,从而提高了模型的稳定性和性能。 最新ai

  • 负载平衡策略:在MoE模块上引入了无辅助损失负载平衡策略。智谱ai开放平台

模型性能ai工具有哪些软件

  • 中文测试:中文测试表现出色,如在CLUEWSC语义理解上得分92.6,为业内领先水平;C-Eval综合知识测试得分92.2超过了包括DeepSeek-V3在内所有对比模型;中文任务平均得分80.5,明显领先;以91.3的平均分超过了DeepSeek开源的V2、V3与阿里 open Qwen2.5 32B、72B。扣子coze下载

  • 数学推理:在MATH500基线测试得到84.8分,接近行业顶尖;在ai智谱ai开放平台ME24竞赛题上得分33.1,体现出处理复杂数学问题的能力;CNMO24(中国数学奥林匹克)得分40.6,数学综合得分60.9。

  • 英语和代码能力:在MMLU、DROP、 GPQA等英语基准测试与Qwen相当,平均得分64.4;代码能力平均分达到了Qwen2.5的水平。阿里大模型

  • 指令和人类偏好对齐:在IFEval、AlpacaEval2、ArenaHard等指令和人类偏好对齐上,平均得分为77.9,表明模型能够准确理解和执行复杂的指令。阿里大模型

成本控制优势最新ai

与Qwen2.5-72B相比,dots.llm1在训练每万亿token时,GPU小时从340K减少到130K,效率提升得益于其独特的通信和计算重叠方案及高效的分组GEMM实现。下载并安装豆包

模型支持与应用场景大魔王ai工具下载

  • 支持功能:支持中英双语,上下文长度达32768个token,还支持function call功能,官方提供的mmlu-pro评测分数比Qwen3-235b-a22b好,但与最新的DeepSeek-V3相当。最新ai

  • 应用场景:结合小红书生活方式分享平台积累的海量高质量UGC内容,以及日均近6亿的搜索量与70%月活用户使用搜索功能,dots.llm1在生活场景对话、创意写作星流ai下载、生活经验答疑等方面有其独特的应用优势,小红书也正在围绕这一点构建自己的AI技术体系。

开源地址:人工智能的应用https://huggingface.co/rednote-hilab/dots.llm1.base/tree/main

收藏
最新工具
Recapo AI
Recapo AI打开豆包打开豆包

一款专为影视解说、赛事集锦和长视频二创打造的AI剪辑平台,支持聊...deeoseek

Mono AI
Mono AIai未来十大趋势

一款AI驱动的游戏开发平台,通过对话描述即可快速生成可上线的游戏...下载并安装豆包

即梦Octo
即梦Octo人工智能的应用

字节旗下即梦推出的协作型AI叙事创作工具,首创"Vib...人工智能的应用

Octask AI
Octask AI下载并安装豆包

光魔科技推出的AI内容工作室平台,把AI能力做成可以协作的数字员...ai未来十大趋势

腾讯Marvis
腾讯Marvis下一个豆包

操作系统级AI助手,内置6个Agent实现文件管理、系统操控、跨...小智ai官网入口

XHS-TextCard
XHS-TextCard小智ai官网入口

面向小红书创作者的开源文字卡片生成工具,它能将Markdown内...扣子coze下载

卡咔CardCrafter AI
卡咔CardCrafter AI人工智能的应用

专为小红书、公众号、抖音创作者打造的AI智能排版平台,有爆款图文...通义千问干啥用的

观云
观云ai未来十大趋势

观云是霓虹比特推出的AI内容再创作工作台,提供公开视频下载、AI...星流ai下载

Lumen Flow
Lumen Flow通义千问干啥用的

基于Seedance 2.0的端到端AI漫剧自动生产线,支持零提...人工智能的应用

灵动prompt
灵动prompt下一个豆包

一个用来生成AI提示词的可视化工具。内置了海报、Logo、小红书...ai工具有哪些软件