Model Optimizer - a nvidia Collection

nvidia 's Collections

Cosmos Transfer1

Llama Nemotron Feedback-Edit Inference-Time Scaling

Cosmos Tokenize1

Cosmos Predict1

Llama-3.1-Nemotron-70B

NVILA-Speech-Audio-Setups

QLIP

Cosmos

DMC

AceMath

Cosmos Tokenizer

Eagle 2

NeMo Audio Codecs

Hymba

Optimized ONNX models for NVIDIA RTX GPUs

Riva

Nemotron 4 340B

SteerLM

Canary

RLHF

Llama3-ChatQA-1.5

SSMs

BigVGAN

RADIO

NIM Serverless Inference API

Model Optimizer

Llama3-ChatQA-2

NeMo Curator - Classifier Models

Model Optimizer

updated about 13 hours ago

A collection of generative models quantized and optimized with TensorRT Model Optimizer.