servTe

Paused

App Files Files Community

Ge-AI commited on May 23, 2025

Commit

6700a38

verified ·

1 Parent(s): 930f348

Upload 4 files

Browse files

Files changed (1) hide show

api.py +15 -6

api.py CHANGED Viewed

@@ -123,7 +123,7 @@ def create_session(apikey, external_user_id=None):
         raise
 # 处理流式请求
-def handle_stream_request(apikey, session_id, query, endpoint_id, model_name):
     url = f"{ONDEMAND_API_BASE}/sessions/{session_id}/query"
     payload = {
         "query": query,
@@ -131,9 +131,11 @@ def handle_stream_request(apikey, session_id, query, endpoint_id, model_name):
         "pluginIds": [],
         "responseMode": "stream",
         "modelConfigs": {
-            "fulfillmentPrompt": "--No Use\n{context}\n--No Use--\n" + CLAUDE_SYSTEM_PROMPT + "{question}"
         }
     }
     headers = {
         "apikey": apikey,
@@ -205,14 +207,20 @@ def handle_stream_request(apikey, session_id, query, endpoint_id, model_name):
         raise
 # 处理非流式请求
-def handle_non_stream_request(apikey, session_id, query, endpoint_id, model_name):
     url = f"{ONDEMAND_API_BASE}/sessions/{session_id}/query"
     payload = {
         "query": query,
         "endpointId": endpoint_id,
         "pluginIds": [],
-        "responseMode": "sync"
     }
     headers = {"apikey": apikey, "Content-Type": "application/json"}
     try:
@@ -257,6 +265,7 @@ def chat_completions():
         model = data.get("model", "gpt-4o")
         endpoint_id = get_endpoint_id(model)
         is_stream = bool(data.get("stream", False))
         # 格式化消息
         formatted_messages = []
@@ -303,7 +312,7 @@ def chat_completions():
                 if is_stream:
                     try:
                         return Response(
-                            handle_stream_request(apikey, session_id, query, endpoint_id, model),
                             content_type='text/event-stream'
                         )
                     except ValueError as ve:
@@ -315,7 +324,7 @@ def chat_completions():
                         raise  # 其他ValueError或超过重试次数，重新抛出
                 else:
                     try:
-                        return handle_non_stream_request(apikey, session_id, query, endpoint_id, model)
                     except ValueError as ve:
                         # 捕获空回复异常
                         if "空回复" in str(ve) and empty_response_retries < max_empty_retries:

         raise
 # 处理流式请求
+def handle_stream_request(apikey, session_id, query, endpoint_id, model_name, temperature=None):
     url = f"{ONDEMAND_API_BASE}/sessions/{session_id}/query"
     payload = {
         "query": query,
         "pluginIds": [],
         "responseMode": "stream",
         "modelConfigs": {
+            "fulfillmentPrompt": "--No Use\n{context}\n--No Use--\n" + CLAUDE_SYSTEM_PROMPT + "{question}",
+            "temperature": temperature
         }
     }
+    logging.info("Temperature: %s", temperature)
     headers = {
         "apikey": apikey,
         raise
 # 处理非流式请求
+def handle_non_stream_request(apikey, session_id, query, endpoint_id, model_name, temperature=None):
     url = f"{ONDEMAND_API_BASE}/sessions/{session_id}/query"
     payload = {
         "query": query,
         "endpointId": endpoint_id,
         "pluginIds": [],
+        "responseMode": "sync",
+        "modelConfigs": {
+            "fulfillmentPrompt": "--No Use\n{context}\n--No Use--\n" + CLAUDE_SYSTEM_PROMPT + "{question}",
+            "temperature": temperature
+        }
     }
+    logging.info("Temperature: %s", temperature)
     headers = {"apikey": apikey, "Content-Type": "application/json"}
     try:
         model = data.get("model", "gpt-4o")
         endpoint_id = get_endpoint_id(model)
         is_stream = bool(data.get("stream", False))
+        temperature = data.get("temperature")
         # 格式化消息
         formatted_messages = []
                 if is_stream:
                     try:
                         return Response(
+                            handle_stream_request(apikey, session_id, query, endpoint_id, model, temperature),
                             content_type='text/event-stream'
                         )
                     except ValueError as ve:
                         raise  # 其他ValueError或超过重试次数，重新抛出
                 else:
                     try:
+                        return handle_non_stream_request(apikey, session_id, query, endpoint_id, model, temperature)
                     except ValueError as ve:
                         # 捕获空回复异常
                         if "空回复" in str(ve) and empty_response_retries < max_empty_retries: