≡ AI工具

Llama Nemotron – 英伟达推出的系列推理模型

分类:AI工具
Llama Nemotron – 英伟达推出的系列推理模型

Llama Nemotron是什么

Llama Nemotron是NVIDIA推出的一系列推理模型,专注于推理和多种智能代理(agentic AI)任务。模型基于Llama开源模型,经过NVIDIA的后训练,加入推理能力,在科学推理、高级数学、编程、指令遵循和工具调用等方面表现出色。Llama Nemotron模型家族包括Nano、Super和Ultra三种类型,分别适用于从轻量级推理到复杂决策的多种企业级AI代理需求。

Nano(llama-3.1-nemotron-nano-8b-v1)基于Llama 3.1 8B微调而来,专为PC和边缘设备而设计。

Super(llama-3.3-nemotron-super-49b-v1)基于Llama 3.3 70B蒸馏而来,针对数据中心GPU进行优化,实现最高吞吐量下的最佳准确性。

Ultra(Llama-3.1-Nemotron-Ultra-253B-v1)基于Llama 3.1 405B蒸馏而来,专为多GPU数据中心打造最强智能体设计,在一系列基准测试中,Llama-3.1-Nemotron-Ultra-253B-v1与DeepSeek R1相当,优于Meta最新发布的Llama 4 Behemoth和Llama 4 Maverick。

Llama Nemotron