Spaces:

aelitta
/

BioMistral_gradio

Running

BioMistral_gradio / privateGPT /settings-docker.yaml

Upload folder using huggingface_hub

4bdb245 verified about 2 months ago

No virus

1.08 kB

	server:
	env_name: ${APP_ENV:prod}
	port: ${PORT:8080}

	llm:
	mode: ${PGPT_MODE:mock}

	embedding:
	mode: ${PGPT_MODE:sagemaker}

	llamacpp:
	llm_hf_repo_id: ${PGPT_HF_REPO_ID:TheBloke/Mistral-7B-Instruct-v0.1-GGUF}
	llm_hf_model_file: ${PGPT_HF_MODEL_FILE:mistral-7b-instruct-v0.1.Q4_K_M.gguf}

	huggingface:
	embedding_hf_model_name: ${PGPT_EMBEDDING_HF_MODEL_NAME:BAAI/bge-small-en-v1.5}

	sagemaker:
	llm_endpoint_name: ${PGPT_SAGEMAKER_LLM_ENDPOINT_NAME:}
	embedding_endpoint_name: ${PGPT_SAGEMAKER_EMBEDDING_ENDPOINT_NAME:}

	ollama:
	llm_model: ${PGPT_OLLAMA_LLM_MODEL:mistral}
	embedding_model: ${PGPT_OLLAMA_EMBEDDING_MODEL:nomic-embed-text}
	api_base: ${PGPT_OLLAMA_API_BASE:http://ollama:11434}
	embedding_api_base: ${PGPT_OLLAMA_EMBEDDING_API_BASE:http://ollama:11434}
	tfs_z: ${PGPT_OLLAMA_TFS_Z:1.0}
	top_k: ${PGPT_OLLAMA_TOP_K:40}
	top_p: ${PGPT_OLLAMA_TOP_P:0.9}
	repeat_last_n: ${PGPT_OLLAMA_REPEAT_LAST_N:64}
	repeat_penalty: ${PGPT_OLLAMA_REPEAT_PENALTY:1.2}
	request_timeout: ${PGPT_OLLAMA_REQUEST_TIMEOUT:600.0}

	ui:
	enabled: true
	path: /