nlpulse
/

gpt-j-6b-english_quotes

Text Generation

Inference Endpoints

Model card Files Files and versions Community

egon-nlpulse commited on Jul 13, 2023

Commit

714fa24

•

1 Parent(s): 49e8900

ajustes

Files changed (1) hide show

README.md +21 -1

README.md CHANGED Viewed

@@ -29,7 +29,24 @@ Details:
 ```
 3 epochs, all dataset samples (split=train), 939 steps
 1 x GPU NVidia RTX 3060 12GB - max. GPU memory: 7.44 GB
-duration: 1h45min
 ```
 ## Inference
@@ -78,3 +95,6 @@ pip install -q -U scipy
 ## Scripts
 [https://github.com/nlpulse-io/sample_codes/tree/main/fine-tuning/peft_quantization_4bits/gptj-6b](https://github.com/nlpulse-io/sample_codes/tree/main/fine-tuning/peft_quantization_4bits/gptj-6b)

 ```
 3 epochs, all dataset samples (split=train), 939 steps
 1 x GPU NVidia RTX 3060 12GB - max. GPU memory: 7.44 GB
+Duration: 1h45min
+$ nvidia-smi && free -h
++-----------------------------------------------------------------------------+
+| NVIDIA-SMI 515.105.01   Driver Version: 515.105.01   CUDA Version: 11.7     |
+|-------------------------------+----------------------+----------------------+
+| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
+| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
+|                               |                      |               MIG M. |
+|===============================+======================+======================|
+|   1  NVIDIA GeForce ...  Off  | 00000000:04:00.0 Off |                  N/A |
+|100%   89C    P2   166W / 170W |   7439MiB / 12288MiB |     93%      Default |
+|                               |                      |                  N/A |
++-------------------------------+----------------------+----------------------+
+               total        used        free      shared  buff/cache   available
+Mem:            77Gi        14Gi        23Gi        79Mi        39Gi        62Gi
+Swap:           37Gi          0B        37Gi
 ```
 ## Inference
 ## Scripts
 [https://github.com/nlpulse-io/sample_codes/tree/main/fine-tuning/peft_quantization_4bits/gptj-6b](https://github.com/nlpulse-io/sample_codes/tree/main/fine-tuning/peft_quantization_4bits/gptj-6b)
+# References
+[https://towardsdatascience.com/qlora-fine-tune-a-large-language-model-on-your-gpu-27bed5a03e2b](https://towardsdatascience.com/qlora-fine-tune-a-large-language-model-on-your-gpu-27bed5a03e2b)