LLaVA-Ortho

Sleeping

App Files Files Community

liuhaotian commited on Feb 3

Commit

14f034e

•

1 Parent(s): 3e4d21c

Init

Browse files

Files changed (2) hide show

app.py +93 -0
requirements.txt +2 -0

app.py ADDED Viewed

	@@ -0,0 +1,93 @@

+import sys
+import os
+import argparse
+import time
+import subprocess
+import llava.serve.gradio_web_server as gws
+def start_controller():
+    print("Starting the controller")
+    controller_command = [
+        "python",
+        "-m",
+        "llava.serve.controller",
+        "--host",
+        "0.0.0.0",
+        "--port",
+        "10000",
+    ]
+    return subprocess.Popen(controller_command)
+def start_worker(model_path: str, bits=16):
+    print(f"Starting the model worker for the model {model_path}")
+    model_name = model_path.strip("/").split("/")[-1]
+    assert bits in [4, 8, 16], "It can be only loaded with 16-bit, 8-bit, and 4-bit."
+    if bits != 16:
+        model_name += f"-{bits}bit"
+    worker_command = [
+        "python",
+        "-m",
+        "llava.serve.model_worker",
+        "--host",
+        "0.0.0.0",
+        "--controller",
+        "http://localhost:10000",
+        "--model-path",
+        model_path,
+        "--model-name",
+        model_name,
+    ]
+    if bits != 16:
+        worker_command += [f"--load-{bits}bit"]
+    return subprocess.Popen(worker_command)
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--host", type=str, default="0.0.0.0")
+    parser.add_argument("--port", type=int)
+    parser.add_argument("--controller-url", type=str, default="http://localhost:10000")
+    parser.add_argument("--concurrency-count", type=int, default=5)
+    parser.add_argument("--model-list-mode", type=str, default="reload", choices=["once", "reload"])
+    parser.add_argument("--share", action="store_true")
+    parser.add_argument("--moderate", action="store_true")
+    parser.add_argument("--embed", action="store_true")
+    gws.args = parser.parse_args()
+    gws.models = []
+    print(f"args: {gws.args}")
+    model_path = "liuhaotian/llava-v1.6-mistral-7b"
+    bits = int(os.getenv("bits", 4))
+    concurrency_count = int(os.getenv("concurrency_count", 5))
+    controller_proc = start_controller()
+    worker_proc = start_worker(model_path, bits=bits)
+    # Wait for worker and controller to start
+    time.sleep(10)
+    exit_status = 0
+    try:
+        demo = gws.build_demo(embed_mode=False, cur_dir='./')
+        demo.queue(
+            concurrency_count=concurrency_count,
+            status_update_rate=10,
+            api_open=False
+        ).launch(
+            server_name=gws.args.host,
+            server_port=gws.args.port,
+            share=gws.args.share
+        )
+    except Exception as e:
+        print(e)
+        exit_status = 1
+    finally:
+        worker_proc.kill()
+        controller_proc.kill()
+        sys.exit(exit_status)

requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ llava-torch==1.2.1.post1
2	+ protobuf==4.23.3