Spaces:

winglian
/

llama-adapter

Paused

llama-adapter / app.py

hardcode model and paths for now...

a375959 over 1 year ago

1.46 kB

	import os
	import sys

	import fire
	import gradio as gr

	from llama_lora.globals import Global
	from llama_lora.ui.main_page import main_page, get_page_title, main_page_custom_css
	from llama_lora.utils.data import init_data_dir


	def main(
	load_8bit: bool = False,
	base_model: str = "decapoda-research/llama-7b-hf",
	data_dir: str = "./datasets",
	# Allows to listen on all interfaces by providing '0.0.0.0'.
	server_name: str = "127.0.0.1",
	share: bool = False,
	skip_loading_base_model: bool = False,
	ui_show_sys_info: bool = True,
	ui_dev_mode: bool = False,
	):
	base_model = base_model or os.environ.get("LLAMA_LORA_BASE_MODEL", "")
	data_dir = data_dir or os.environ.get("LLAMA_LORA_DATA_DIR", "")
	assert (
	base_model
	), "Please specify a --base_model, e.g. --base_model='decapoda-research/llama-7b-hf'"

	assert (
	data_dir
	), "Please specify a --data_dir, e.g. --data_dir='./data'"

	Global.default_base_model_name = base_model
	Global.data_dir = os.path.abspath(data_dir)
	Global.load_8bit = load_8bit

	Global.ui_dev_mode = ui_dev_mode
	Global.ui_show_sys_info = ui_show_sys_info

	os.makedirs(data_dir, exist_ok=True)
	init_data_dir()

	with gr.Blocks(title=get_page_title(), css=main_page_custom_css()) as demo:
	main_page()

	demo.queue(concurrency_count=1).launch(server_name=server_name, share=share)


	if __name__ == "__main__":
	fire.Fire(main)