baichuan-13b-chat-try

Runtime error

App Files Files Community

Hilda Cran May

mikeee commited on Sep 11, 2023

Commit

db2a738

0 Parent(s):

Duplicate from mikeee/baichuan-13b-chat-try

Browse files

Co-authored-by: mikeee <mikeee@users.noreply.huggingface.co>

Files changed (4) hide show

.gitattributes +35 -0
README.md +13 -0
app.py +82 -0
requirements.txt +13 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: Baichuan 13b Chat Try
+emoji: 🌍
+colorFrom: blue
+colorTo: blue
+sdk: gradio
+sdk_version: 3.43.2
+app_file: app.py
+pinned: false
+duplicated_from: mikeee/baichuan-13b-chat-try
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,82 @@

+# pylint: disable=invalid-name, line-too-long, missing-module-docstring
+import gc
+import os
+import time
+import gradio
+import rich
+import torch
+from huggingface_hub import snapshot_download
+from loguru import logger
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from transformers.generation.utils import GenerationConfig
+model_name = "baichuan-inc/Baichuan2-13B-Chat-4bits"
+if not torch.cuda.is_available():
+    gradio.Error(f"No cuda, cant run {model_name}")
+    raise SystemError(f"No cuda, cant run {model_name}")
+# snapshot_download?
+loc = snapshot_download(repo_id=model_name, local_dir="model")
+# fix timezone in Linux
+os.environ["TZ"] = "Asia/Shanghai"
+try:
+    time.tzset()  # type: ignore # pylint: disable=no-member
+except Exception:  # pylint: disable=broad-except
+    # Windows
+    logger.warning("Windows, cant run time.tzset()")
+model = None
+gc.collect()  # for interactive testing
+logger.info("start")
+has_cuda = torch.cuda.is_available()
+tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=False, trust_remote_code=True)
+if has_cuda:
+    model = AutoModelForCausalLM.from_pretrained(
+        "model",  # loc
+        device_map="auto",
+        torch_dtype=torch.bfloat16,  # pylint: disable=no-member
+        load_in_8bit=True,
+        trust_remote_code=True,
+        # use_ram_optimized_load=False,
+        # offload_folder="offload_folder",
+    )  # .cuda()
+else:
+    try:
+        # model = AutoModel.from_pretrained(model_name, trust_remote_code=True).float()
+        model = AutoModelForCausalLM.from_pretrained(
+            # model_name, trust_remote_code=True
+            "model",
+            trust_remote_code=True,
+        )  # .float() not supported
+    except Exception as exc:
+        logger.error(exc)
+        logger.warning("Doesnt seem to load for CPU...")
+        raise SystemExit(1) from exc
+    model = model.eval()
+rich.print(f"{model=}")
+logger.info("done")
+tokenizer = AutoTokenizer.from_pretrained(
+    "baichuan-inc/Baichuan2-13B-Chat-4bits", use_fast=False, trust_remote_code=True
+)
+# model = AutoModelForCausalLM.from_pretrained("baichuan-inc/Baichuan2-13B-Chat-4bits", device_map="auto", torch_dtype=torch.bfloat16, trust_remote_code=True)
+model.generation_config = GenerationConfig.from_pretrained(
+    "baichuan-inc/Baichuan2-13B-Chat-4bits"
+)
+messages = []
+messages.append({"role": "user", "content": "解释一下“温故而知新”"})
+response = model.chat(tokenizer, messages)
+rich.print(response)
+logger.info(f"{response=}")

requirements.txt ADDED Viewed

	@@ -0,0 +1,13 @@

+install
+torch
+transformers
+sentencepiece
+accelerate
+bitsandbytes
+xformers
+scipy
+rich
+loguru
+huggingface_hub