英伟达开源 Nemotron-Mini-4B-Instruct 小语言模型
创始人
2024-09-15 14:48:20
0

IT之家 9 月 15 日消息,科技媒体 marktechpost 昨日(9 月 14 日)发布博文,报道称英伟达开源了 Nemotron-Mini-4B-Instruct AI 模型,标志着该公司在 AI 领域创新又一新篇章。

小语言模型的大潜力

Nemotron-Mini-4B-Instruct AI 模型专为角色扮演、检索增强生成(RAG)及函数调用等任务设计,是一个小语言模型(SLM),通过蒸馏(distilled)和优化更大的 Nemotron-4 15B 获得。

英伟达使用剪枝(pruning)、量化(quantization)和蒸馏(distillation)等先进 AI 技术,让该模型更小巧高效,尤其适用于设备端部署。

这种缩小化并未影响模型在角色扮演和功能调用等特定场景下的性能,让其成为需要快速按需响应的应用的实用选择。

该模型在 Minitron-4B-Base 模型上微调,采用了 LLM 压缩技术,最显著的特点之一是其能够处理 4096 个上下文窗口词元(token),能够生成更长且更连贯的回复。

架构与技术规格

Nemotron-Mini-4B-Instruct 以其强大的架构著称,确保了高效性与可扩展性。

该模型的 Embedding Size(决定了转化后的向量的维度)尺寸为 3072,多头注意力(Multi-Head Attention)为 32 个,MLP 中间维度为 9216,在处理大规模输入数据集时,仍能以高精度和相关性作出响应。

此外,模型还采用了组查询注意力(GQA)和旋转位置嵌入(RoPE)技术,进一步提升了其处理与理解文本的能力。

该模型基于 Transformer 解码器架构,是一种自回归语言模型。这意味着它根据前面的标记生成每个标记,非常适合对话生成等任务,其中对话的连贯流畅至关重要。

角色扮演与功能调用应用

Nemotron-Mini-4B-Instruct 在角色扮演应用领域表现尤为突出。凭借其庞大的标记容量和优化的语言生成能力,它可以嵌入到虚拟助手、视频游戏或任何其他需要 AI 生成关键响应的交互式环境中。

英伟达提供了一种特定的提示格式,以确保模型在这些场景中,尤其是在单轮或多轮对话中,输出最佳结果。

该模型还针对函数调用进行了优化,在 AI 系统必须与 API 或其他自动化流程交互的环境中变得越来越重要。生成准确、功能性响应的能力使得该模型非常适合 RAG 场景,即模型需要创建文本并从知识库中检索和提供信息。

IT之家附上参考地址

相关内容

越是AI,越需人文
今年的全国两会,“人工智能”成为高频词。政府工作报告也明确提出,深...
2026-03-15 13:13:11
千问AI眼镜亮相AWE,观...
3月12日,中国家电及消费电子博览会(简称“AWE 2026”)在...
2026-03-15 13:07:05
大晓机器人开源Kairos...
上证报中国证券网讯(记者 宋薇萍)记者3月13日从大晓机器人获悉,...
2026-03-15 13:02:52
端侧直接跑!大晓机器人开源...
IT时报记者 孙妍 近日,大晓机器人开源开悟世界模型 3.0(Ka...
2026-03-14 00:35:09
北大团队首创"电...
这项由北京大学、快手科技、华南理工大学、电子科技大学、香港大学以及...
2026-03-13 19:48:44
AI内容泛滥,“倒逼”长视...
春节至今,不到一个月的时间,影视娱乐行业迎来了两次重大事件。 一是...
2026-03-13 19:47:28

热门资讯

原创 2... #春日生活好物种草季#近年来,笔记本电脑市场迎来技术爆发期,尤其在手机厂商跨界入局后,轻薄本在性能、...
AMD锐龙AI 9 HX 37... 2024年6月3日,AMD正式发布全新的锐龙AI 300系列处理器。该系列处理器一经发布就引发大家的...
2024云栖大会|阿里云升级无... 北京商报讯(记者魏蔚)9月20日,阿里云无影AI云电脑在2024云栖大会上展出,该版本基于最新的终端...
5个AI模特生成软件推荐 当前AI模特生成软件市场提供了多样化的解决方案,以下是几款备受推崇的工具: 触站AI:强烈推荐!...
骁龙本这么猛?联想YOGA A... 在人人都是自媒体的时代,一部手机可以解决出镜拍摄问题,而商务出差、大量码字、图像处理等需求用笔记本则...
2023年CentOS与Ubu... CentOS与Ubuntu的市场格局与技术特性探讨 在服务器操作系统领域,CentOS与Ubuntu...
MWC2025荣耀多款AI技术... 人民财讯3月6日电,2025世界移动通信大会(MWC 2025)上,荣耀MagicBook Pro ...
苹果macOS 15.1:允许... 苹果公司在其最新的macOS 15.1版本中,推出了一项引人注目的新功能——允许用户将Mac App...
原创 苹... 前言 IQUNIX在做好看的桌面产品上,一直都给我留下非常深刻的印象。而且早期和苹果产品的设计风格...
原创 华... 在2024年这个被誉为"AI元年"的关键时刻,随着生成式AI的流行,各家手机厂商都在积极备战AI手机...