Models
Datasets
Spaces
Posts
Docs
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2404.05829

Rho-1: Not All Tokens Are What You Need

Paper • 2404.07965 • Published Apr 11 • 79
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time

Paper • 2404.10667 • Published Apr 16 • 12
Instruction-tuned Language Models are Better Knowledge Learners

Paper • 2402.12847 • Published Feb 20 • 25
DoRA: Weight-Decomposed Low-Rank Adaptation

Paper • 2402.09353 • Published Feb 14 • 18

multi-lingual llms

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8 • 11

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8 • 11

SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8 • 11

Expert models that adapt Llama2 to a diverse set of languages from around the world.

about 1 month ago

Runtime error

42

🌍

SambaLingo Chat Space
SambaLingo: Teaching Large Language Models New Languages

Paper • 2404.05829 • Published Apr 8 • 11
sambanovasystems/SambaLingo-Arabic-Chat

Text Generation • Updated Apr 16 • 1.48k • 53
sambanovasystems/SambaLingo-Arabic-Base

Text Generation • Updated 3 days ago • 105 • 36

Japanese LLMs (papers)

Continual Pre-Training for Cross-Lingual LLM Adaptation: Enhancing Japanese Language Capabilities

Paper • 2404.17790 • Published 21 days ago • 1
Construction of Domain-specified Japanese Large Language Model for Finance through Continual Pre-training

Paper • 2404.10555 • Published Apr 16 • 2
Pretraining and Updating Language- and Domain-specific Large Language Model: A Case Study in Japanese Business Domain

Paper • 2404.08262 • Published Apr 12 • 1
Heron-Bench: A Benchmark for Evaluating Vision Language Models in Japanese

Paper • 2404.07824 • Published Apr 11 • 2

Company

© Hugging Face

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs