microsoft
/

phi-1_5

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

Adding `safetensors` variant of this model

7e19e91
verified

SFconvertbot commited on Mar 27

Update LICENSE

bffd3b2
verified

gugarosa commited on Feb 6

Update README.md

349cf8b
verified

gugarosa commited on Jan 24

Update README.md

83b9c52
verified

gugarosa commited on Jan 22

Update config.json

675e8c1
verified

gugarosa commited on Jan 22

Update modeling_phi.py

34a1490
verified

gugarosa commited on Jan 16

Update README.md

59e722d
verified

gugarosa commited on Jan 16

Update modeling_phi.py

426ea90
verified

gugarosa commited on Jan 15

Update modeling_phi.py

3edb5e6
verified

gugarosa commited on Jan 12

Update modeling_phi.py

e0f03c4
verified

gugarosa commited on Jan 11

Update config.json

051d15f
verified

gugarosa commited on Jan 11

Upload modeling_phi.py

914c8fb

gugarosa commited on Jan 10

Delete Research License.docx

3a705a2

gugarosa commited on Jan 10

Upload 5 files

341a17a

gugarosa commited on Jan 10

Update README.md (#69)

1dc35eb

mojanjp commited on Jan 10

Update config.json

41217aa

gugarosa commited on Jan 8

chore(root): Updates files to internal transformers implementation.

d3ba318

gugarosa commited on Jan 8

Update README.md

24f9ea1

gugarosa commited on Dec 13, 2023

Upload 4 files

d262514

gugarosa commited on Dec 13, 2023

Update README.md

f27cd93

gugarosa commited on Dec 13, 2023

Update README.md

80c0ba9

gugarosa commited on Dec 13, 2023

Disables inference API to prevent mismatch with HF implementation.

a286f5c

gugarosa commited on Dec 13, 2023

fix(modeling_phi): Fixes initial generation with length larger than context length.

ca573e3

gugarosa commited on Dec 8, 2023

fix(modeling_phi): Fixes cached generation when above maximum context length.

37527ba

gugarosa commited on Dec 5, 2023

Fixes exceeding maximum sequence length when using generate().

5fd430c

gugarosa commited on Nov 20, 2023

Delete modeling_mixformer_sequential.py

d212a78

gugarosa commited on Nov 16, 2023

Delete configuration_mixformer_sequential.py

8e9ebfb

gugarosa commited on Nov 16, 2023

Update to new model interface.

271c339

gugarosa commited on Nov 16, 2023

Improves type hinting on configuration arguments.

92557d0

gugarosa commited on Nov 1, 2023

Enables to toggle fused_dense, flash_rotary and attn_pdrop in the configuration.

45f4b21

gugarosa commited on Nov 1, 2023

Fixes flash-attn import with a try/except statement

0254d42

gugarosa commited on Nov 1, 2023

Adds support for flash-attn rotary embedding and fused dense layers.

0bbd68a

gugarosa commited on Nov 1, 2023

Adds support for MQA/GQA and attention mask during training.

de35f90

gugarosa commited on Oct 30, 2023

Update modeling_mixformer_sequential.py

d38e6f9

gugarosa commited on Oct 26, 2023

Adding _set_gradient_checkpointing for compatibility (#22)

8091327

vriveras commited on Oct 17, 2023

Upload modeling_mixformer_sequential.py

b6a7e2f

gugarosa commited on Sep 27, 2023

Add more precise license metadata (UI will be cleaner!) (#35)

8ab0f29

julien-c HF staff commited on Sep 27, 2023

Upload README.md

bc09a08

gugarosa commited on Sep 27, 2023

fix(phi-1_5): Checks length of `attention_mask`if it is passed as direct tensor.

f9f2ac7

gugarosa commited on Sep 26, 2023

Support for `attention_mask` in forward pass.

3128bb6

gugarosa commited on Sep 26, 2023

add _no_split_modules property (#17)

4a426d8

winglian commited on Sep 15, 2023

Update README.md

7d482dd

suriyagunasekar commited on Sep 14, 2023

Update README.md

c8f6ad8

suriyagunasekar commited on Sep 12, 2023

Link paper to arXiv (#5)

762a311

osanseviero commited on Sep 12, 2023

Update README.md

ea95720

suriyagunasekar commited on Sep 12, 2023

Update README.md

4bba51c

suriyagunasekar commited on Sep 11, 2023

Update README.md

52e294a

suriyagunasekar commited on Sep 11, 2023

Upload tokenizer

9efbcaf

suriyagunasekar commited on Sep 11, 2023

Upload MixFormerSequentialForCausalLM

d655135

suriyagunasekar commited on Sep 11, 2023

Update README.md

07a048e

suriyagunasekar commited on Sep 11, 2023