microsoft
/

phi-1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

Update README.md

07d9363
verified

gugarosa commited on Jan 16

Update modeling_phi.py

03b9f69
verified

gugarosa commited on Jan 12

Update modeling_phi.py

54bed1a
verified

gugarosa commited on Jan 12

Update modeling_phi.py

50bb267
verified

gugarosa commited on Jan 11

Upload modeling_phi.py

2cfa65f

gugarosa commited on Jan 10

Delete Research License.docx

957a783

gugarosa commited on Jan 9

Upload 5 files

1cb0668

gugarosa commited on Jan 9

Update config.json

3e53f58

gugarosa commited on Jan 8

Update modeling_phi.py

e575241

gugarosa commited on Jan 8

Update modeling_phi.py

4e6ed66

gugarosa commited on Jan 5

Update configuration_phi.py

fbf395a

gugarosa commited on Jan 5

fix(root): Fixes relative paths.

b908838

gugarosa commited on Jan 5

chore(root): Updates files to internal transformers implementation.

8a2c68b

gugarosa commited on Jan 5

Update README.md

530294c

gugarosa commited on Dec 13, 2023

Upload 4 files

b3ebf08

gugarosa commited on Dec 13, 2023

Update README.md

304b058

gugarosa commited on Dec 13, 2023

Update README.md

654b690

gugarosa commited on Dec 13, 2023

chore(readme): Updates with clear information.

eac5218

gugarosa commited on Dec 13, 2023

Disables inference API to prevent mismatch with HF implementation.

e8a38cd

gugarosa commited on Dec 13, 2023

fix(modeling_phi): Fixes initial generation with length larger than context length.

f4e55a8

gugarosa commited on Dec 8, 2023

fix(modeling_phi): Fixes cached generation when above maximum context length.

ecfe56e

gugarosa commited on Dec 5, 2023

Fixes exceeding maximum sequence length when using generate().

759d148

gugarosa commited on Nov 20, 2023

Uses native torch decorator for disabling autocast.

5819d04

gugarosa commited on Nov 16, 2023

Adds disable_autocast support for different device types.

67ecc75

gugarosa commited on Nov 16, 2023

Fixes any potential overflow when calculating attention weights.

b5c5161

gugarosa commited on Nov 16, 2023

Delete modeling_mixformer_sequential.py

470e18a

gugarosa commited on Nov 9, 2023

Delete configuration_mixformer_sequential.py

bd98e4e

gugarosa commited on Nov 9, 2023

Upload pytorch_model.bin

34b22f4

gugarosa commited on Nov 9, 2023

Update to new model interface.

bbace88

gugarosa commited on Nov 9, 2023

Improves type hinting on configuration arguments.

8d2c4ce

gugarosa commited on Nov 1, 2023

Fixes flash-attn import with a try/except statement

9ed5987

gugarosa commited on Nov 1, 2023

Adds support for flash-attn rotary embedding and fused dense layers.

90c38d9

gugarosa commited on Nov 1, 2023

Adds support for MQA/GQA and attention mask during training / fine-tuning.

371fd51

gugarosa commited on Oct 30, 2023

Upload modeling_mixformer_sequential.py

633bca1

gugarosa commited on Sep 27, 2023

Upload README.md

769684a

gugarosa commited on Sep 27, 2023

fix(phi-1): Checks length of `attention_mask`if it is passed as direct tensor.

1f890f7

gugarosa commited on Sep 26, 2023

Support for `attention_mask` in forward pass.

d22f35e

gugarosa commited on Sep 26, 2023

Update README.md

621f844

suriyagunasekar commited on Sep 11, 2023

Upload tokenizer

7a24267

suriyagunasekar commited on Sep 11, 2023

Upload MixFormerSequentialForCausalLM

44cca9f

suriyagunasekar commited on Sep 11, 2023

Update README.md

3034d33

suriyagunasekar commited on Sep 11, 2023

Update README.md

1121e12

suriyagunasekar commited on Sep 11, 2023

Update README.md

3e86fe1

suriyagunasekar commited on Sep 11, 2023

Update generation_config.json

a85c61b

suriyagunasekar commited on Sep 11, 2023

Update generation_config.json

cb13e96

suriyagunasekar commited on Sep 11, 2023

Update generation_config.json

a15ded7

suriyagunasekar commited on Sep 11, 2023

Update README.md

ba068cc

suriyagunasekar commited on Sep 11, 2023

Update README.md

4cb33c4

suriyagunasekar commited on Sep 11, 2023

Update README.md

3cf35a2

suriyagunasekar commited on Sep 11, 2023

Update README.md

9e27d7d

suriyagunasekar commited on Sep 11, 2023