alexkueck commited on
Commit
5bf144f
·
1 Parent(s): f4e05be

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +59 -3
app.py CHANGED
@@ -72,8 +72,8 @@ YOUTUBE_URL_3 = "https://www.youtube.com/watch?v=vw-KWfKwvTQ"
72
 
73
  ################################################
74
  #LLM Model mit dem gearbeitet wird
75
- #MODEL_NAME = "gpt-3.5-turbo-16k"
76
- MODEL_NAME ="gpt-4"
77
 
78
  #################################################
79
  #Funktionen zur Verarbeitung
@@ -193,6 +193,7 @@ def invoke(openai_api_key, rag_option, prompt):
193
  #GUI
194
  ###############################################
195
  #Beschreibung oben in GUI
 
196
  description = """<strong>Überblick:</strong> Hier wird ein <strong>Large Language Model (LLM)</strong> mit
197
  <strong>Retrieval Augmented Generation (RAG)</strong> auf <strong>externen Daten</strong> demonstriert.\n\n
198
  <strong>Genauer:</strong> Folgende externe Daten sind als Beispiel gegeben:
@@ -204,6 +205,7 @@ description = """<strong>Überblick:</strong> Hier wird ein <strong>Large Langua
204
  <li>Experimentiere mit Prompts, z.B. Antworte in deutsch, englisch, ..." oder "schreibe ein Python Programm, dass die GPT-4 API aufruft."</li>
205
  </ul>\n\n
206
  """
 
207
  #Gradio......
208
  gr.close_all()
209
  demo = gr.Interface(fn=invoke,
@@ -214,4 +216,58 @@ demo = gr.Interface(fn=invoke,
214
  outputs = [gr.Textbox(label = "Completion", lines = 1)],
215
  title = "Generative AI - LLM & RAG",
216
  description = description)
217
- demo.launch()
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
72
 
73
  ################################################
74
  #LLM Model mit dem gearbeitet wird
75
+ MODEL_NAME = "gpt-3.5-turbo-16k"
76
+ #MODEL_NAME ="gpt-4"
77
 
78
  #################################################
79
  #Funktionen zur Verarbeitung
 
193
  #GUI
194
  ###############################################
195
  #Beschreibung oben in GUI
196
+
197
  description = """<strong>Überblick:</strong> Hier wird ein <strong>Large Language Model (LLM)</strong> mit
198
  <strong>Retrieval Augmented Generation (RAG)</strong> auf <strong>externen Daten</strong> demonstriert.\n\n
199
  <strong>Genauer:</strong> Folgende externe Daten sind als Beispiel gegeben:
 
205
  <li>Experimentiere mit Prompts, z.B. Antworte in deutsch, englisch, ..." oder "schreibe ein Python Programm, dass die GPT-4 API aufruft."</li>
206
  </ul>\n\n
207
  """
208
+ """
209
  #Gradio......
210
  gr.close_all()
211
  demo = gr.Interface(fn=invoke,
 
216
  outputs = [gr.Textbox(label = "Completion", lines = 1)],
217
  title = "Generative AI - LLM & RAG",
218
  description = description)
219
+ demo.launch()
220
+ """
221
+
222
+
223
+ ###########################################
224
+ title = "LLM mit RAG"
225
+ description = """<strong>Überblick:</strong> Hier wird ein <strong>Large Language Model (LLM)</strong> mit
226
+ <strong>Retrieval Augmented Generation (RAG)</strong> auf <strong>externen Daten</strong> demonstriert.\n\n
227
+ <strong>Genauer:</strong> Folgende externe Daten sind als Beispiel gegeben:
228
+ <a href='""" + YOUTUBE_URL_1 + """'>YouTube</a>, <a href='""" + PDF_URL + """'>PDF</a>, and <a href='""" + WEB_URL + """'>Web.</a> <br>
229
+ Alle neueren Datums!.
230
+ <ul style="list-style-type:square;">
231
+ <li>Setze "Retrieval Augmented Generation" auf "<strong>Off</strong>" und gib einen Prompt ein." Das entspricht <strong> ein LLM nutzen ohne RAG</strong></li>
232
+ <li>Setze "Retrieval Augmented Generation" to "<strong>Chroma</strong>" und gib einen Prompt ein. Das <strong>LLM mit RAG</strong> weiß auch Antworten zu aktuellen Themen aus den angefügten Datenquellen</li>
233
+ <li>Experimentiere mit Prompts, z.B. Antworte in deutsch, englisch, ..." oder "schreibe ein Python Programm, dass die GPT-4 API aufruft."</li>
234
+ </ul>\n\n
235
+ """
236
+ css = """.toast-wrap { display: none !important } """
237
+ examples=[['Was ist ChtGPT-4?'],['schreibe ein Python Programm, dass die GPT-4 API aufruft.']]
238
+
239
+ def vote(data: gr.LikeData):
240
+ if data.liked: print("You upvoted this response: " + data.value)
241
+ else: print("You downvoted this response: " + data.value)
242
+
243
+ additional_inputs = [
244
+ gr.Textbox(label = "OpenAI API Key", value = "sk-", lines = 1),
245
+ gr.Radio(["Off", "Chroma"], label="Retrieval Augmented Generation", value = "Off"),
246
+ gr.Slider(label="Temperature", value=0.9, minimum=0.0, maximum=1.0, step=0.05, interactive=True, info="Höhere Werte erzeugen diversere Antworten"),
247
+ gr.Slider(label="Max new tokens", value=256, minimum=0, maximum=4096, step=64, interactive=True, info="Maximale Anzahl neuer Tokens"),
248
+ gr.Slider(label="Top-p (nucleus sampling)", value=0.6, minimum=0.0, maximum=1, step=0.05, interactive=True, info="Höhere Werte verwenden auch Tokens mit niedrigerer Wahrscheinlichkeit."),
249
+ gr.Slider(label="Repetition penalty", value=1.2, minimum=1.0, maximum=2.0, step=0.05, interactive=True, info="Strafe für wiederholte Tokens")
250
+ ]
251
+
252
+ chatbot_stream = gr.Chatbot(avatar_images=(
253
+ "https://drive.google.com/uc?id=18xKoNOHN15H_qmGhK__VKnGjKjirrquW",
254
+ "https://drive.google.com/uc?id=1tfELAQW_VbPCy6QTRbexRlwAEYo8rSSv"
255
+ ), bubble_full_width = False)
256
+
257
+ chat_interface_stream = gr.ChatInterface(
258
+ invoke,
259
+ title=title,
260
+ description=description,
261
+ chatbot=chatbot_stream,
262
+ css=css,
263
+ examples=examples,
264
+ )
265
+
266
+ with gr.Blocks() as demo:
267
+ with gr.Tab("General LLM"):
268
+ chatbot_stream.like(vote, None, None)
269
+ chat_interface_stream.render()
270
+ with gr.Row():
271
+ gr.Radio(["Off", "Chroma"], label="Retrieval Augmented Generation", value = "Off"),
272
+
273
+ demo.queue(concurrency_count=75, max_size=100).launch(debug=True)