Commits · flax-community/dalle-mini

feat(train): handle distributed_shampoo in pjit

032f623

boris commited on Jan 24, 2022

feat: update distributed_shampoo + fix None spec

8a9e367

boris commited on Jan 24, 2022

feat(train): distributed_shampoo with pjit

cc34d07

boris commited on Jan 24, 2022

feat(train): use pjit (#125)

f5239e1
unverified

boris commited on Jan 23, 2022

style: unsused import

7a176b9

boris commited on Jan 23, 2022

fix style

f044cb8

boris commited on Jan 23, 2022

feat(train): restore opt_state efficiently

1bfc1b5

boris commited on Jan 23, 2022

feat(model): clean way to load on cpu

12f323d

boris commited on Jan 22, 2022

feat(train): load model on CPU

3d43591

boris commited on Jan 22, 2022

feat(train): different rng per node

2d212d8

boris commited on Jan 22, 2022

feat(train): no batch dimension with pjit

df1fe19

boris commited on Jan 22, 2022

feat(train): progress on pjit

49597a2

boris commited on Jan 22, 2022

feat(train): start pjit support

0081723

boris commited on Jan 21, 2022

feat: use_artifact if run existing

a5ed112

boris commited on Jan 20, 2022

Load from wandb artifact (#121)

f69b21b
unverified

boris commited on Jan 20, 2022

Style (isort).

f9d51f7

Pedro Cuenca commited on Jan 20, 2022

feat(train): update sweep config

bbbf7c8

boris commited on Jan 19, 2022

Use DalleBartTokenizer. State restoration reverted to previous method:

ae983d7

Pedro Cuenca commited on Jan 18, 2022

Tokenizer, config, model can be loaded from wandb.

7e48337

Pedro Cuenca commited on Jan 18, 2022

fix(train): variable not defined

4c87adf

boris commited on Jan 18, 2022

feat(train): cleanup args

a2bf605

boris commited on Jan 18, 2022

Merge pull request #122 from borisdayma/feat-acccum

c91ceb7
unverified

boris commited on Jan 17, 2022

feat(data): support accumulation in non-streaming

88c8e06

boris commited on Jan 17, 2022

refactor(train): cleanup

274ba73

boris commited on Jan 17, 2022

feat: custom gradient accumulation

2d07559

boris commited on Jan 17, 2022

fix: style

df01fa8

boris commited on Jan 16, 2022