Commits · aws-neuron/optimum-neuron-cache

Add more batch_size for mistral on smaller instances

545cd4d
verified

dacorvo HF staff commited on May 31

Update Mistral cached configurations

ee458f5
verified

dacorvo HF staff commited on May 31

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model

695b341
verified

dacorvo HF staff commited on May 30

Remove llama2 7B config for 24 cores

17e7257
verified

dacorvo HF staff commited on May 15

Update inference-cache-config/llama3.json

5d8c4f2
verified

dacorvo HF staff commited on May 13

Update inference-cache-config/llama3.json

f5aae68
verified

dacorvo HF staff commited on Apr 20

Create llama3.json

f93cadb
verified

dacorvo HF staff commited on Apr 19

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json

f06a55a
verified

dacorvo HF staff commited on Apr 19

Add more gpt2 configurations

3fbf810
verified

dacorvo HF staff commited on Apr 9

Add more llama config

2d87237
verified

dacorvo HF staff commited on Apr 9

Add Mistral-v2

20e585f
verified

dacorvo HF staff commited on Apr 9

Create stable-diffusion.json (#43)

32561fe
verified

philschmid HF staff

Jingya HF staff commited on Apr 4

Remove SalesForce embedding model

1cd13f9
verified

dacorvo HF staff commited on Mar 25

Add Zephyr to mistral variants

9164704
verified

dacorvo HF staff commited on Mar 21

Remove variants from main mistral config

ef07aca
verified

dacorvo HF staff commited on Mar 21

Add mistral most popular variants

d3983e8
verified

dacorvo HF staff commited on Mar 21

Add most popular llama variants

594abb2
verified

dacorvo HF staff commited on Mar 21

Added teknium/OpenHermes-2.5-Mistral-7B

1518247
verified

dacorvo HF staff commited on Mar 8

Added Llama-70b batch_size 4 to inference cache

593822e
verified

dacorvo HF staff commited on Mar 8

Create mistral.json

b5d0afd
verified

philschmid HF staff commited on Mar 5

Create gpt2.json

3bdb891
verified

philschmid HF staff commited on Mar 5

Create inference-cache-config/llama.json

1960ccb
verified

philschmid HF staff commited on Mar 5

aws-neuron
/

optimum-neuron-cache

Commit History

Add more batch_size for mistral on smaller instances

545cd4d
verified

Update Mistral cached configurations

ee458f5
verified

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model

695b341
verified

Remove llama2 7B config for 24 cores

17e7257
verified

Update inference-cache-config/llama3.json

5d8c4f2
verified

Update inference-cache-config/llama3.json

f5aae68
verified

Create llama3.json

f93cadb
verified

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json

f06a55a
verified

Add more gpt2 configurations

3fbf810
verified

Add more llama config

2d87237
verified

Add Mistral-v2

20e585f
verified

Create stable-diffusion.json (#43)

32561fe
verified

Remove SalesForce embedding model

1cd13f9
verified

Add Zephyr to mistral variants

9164704
verified

Remove variants from main mistral config

ef07aca
verified

Add mistral most popular variants

d3983e8
verified

Add most popular llama variants

594abb2
verified

Added teknium/OpenHermes-2.5-Mistral-7B

1518247
verified

Added Llama-70b batch_size 4 to inference cache

593822e
verified

Create mistral.json

b5d0afd
verified

Create gpt2.json

3bdb891
verified

Create inference-cache-config/llama.json

1960ccb
verified

Commit History

Add more batch_size for mistral on smaller instances 545cd4d verified

Update Mistral cached configurations ee458f5 verified

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model 695b341 verified

Remove llama2 7B config for 24 cores 17e7257 verified

Update inference-cache-config/llama3.json 5d8c4f2 verified

Update inference-cache-config/llama3.json f5aae68 verified

Create llama3.json f93cadb verified

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json f06a55a verified

Add more gpt2 configurations 3fbf810 verified

Add more llama config 2d87237 verified

Add Mistral-v2 20e585f verified

Create stable-diffusion.json (#43) 32561fe verified

Remove SalesForce embedding model 1cd13f9 verified

Add Zephyr to mistral variants 9164704 verified

Remove variants from main mistral config ef07aca verified

Add mistral most popular variants d3983e8 verified

Add most popular llama variants 594abb2 verified

Added teknium/OpenHermes-2.5-Mistral-7B 1518247 verified

Added Llama-70b batch_size 4 to inference cache 593822e verified

Create mistral.json b5d0afd verified

Create gpt2.json 3bdb891 verified

Create inference-cache-config/llama.json 1960ccb verified

Add more batch_size for mistral on smaller instances

545cd4d
verified

Update Mistral cached configurations

ee458f5
verified

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model

695b341
verified

Remove llama2 7B config for 24 cores

17e7257
verified

Update inference-cache-config/llama3.json

5d8c4f2
verified

Update inference-cache-config/llama3.json

f5aae68
verified

Create llama3.json

f93cadb
verified

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json

f06a55a
verified

Add more gpt2 configurations

3fbf810
verified

Add more llama config

2d87237
verified

Add Mistral-v2

20e585f
verified

Create stable-diffusion.json (#43)

32561fe
verified

Remove SalesForce embedding model

1cd13f9
verified

Add Zephyr to mistral variants

9164704
verified

Remove variants from main mistral config

ef07aca
verified

Add mistral most popular variants

d3983e8
verified

Add most popular llama variants

594abb2
verified

Added teknium/OpenHermes-2.5-Mistral-7B

1518247
verified

Added Llama-70b batch_size 4 to inference cache

593822e
verified

Create mistral.json

b5d0afd
verified

Create gpt2.json

3bdb891
verified

Create inference-cache-config/llama.json

1960ccb
verified