MarcGrumpyOlejak commited on
Commit
c40e42c
1 Parent(s): 5d807df

Update README.md

Browse files

Added explanations and image.

Files changed (1) hide show
  1. README.md +42 -3
README.md CHANGED
@@ -1,16 +1,55 @@
1
  ---
2
  base_model:
 
3
  - DiscoResearch/DiscoLM_German_7b_v1
4
  library_name: transformers
5
  tags:
6
  - mergekit
7
  - merge
8
-
 
 
9
  ---
10
- # Untitled Model (1)
11
 
 
 
12
  This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
13
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
14
  ## Merge Details
15
  ### Merge Method
16
 
@@ -20,7 +59,7 @@ This model was merged using the SLERP merge method.
20
 
21
  The following models were included in the merge:
22
  * [DiscoResearch/DiscoLM_German_7b_v1](https://huggingface.co/DiscoResearch/DiscoLM_German_7b_v1)
23
- * /home/marc/Austausch/LLMs/VerwaltungsAnthologie_clear_simbad_7B/
24
 
25
  ### Configuration
26
 
 
1
  ---
2
  base_model:
3
+ - MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B
4
  - DiscoResearch/DiscoLM_German_7b_v1
5
  library_name: transformers
6
  tags:
7
  - mergekit
8
  - merge
9
+ language:
10
+ - de
11
+ - en
12
  ---
13
+ ![VA Disco_simbad](VA_Disco_simbad_7B.png)
14
 
15
+ # VerwaltungsAnthologie_Disco_simbad_7B
16
+ This is my second "usable" POC of a german based text summarizer. Mass comparisons based upon tagesschau texts still have to be done.
17
  This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
18
 
19
+ ### GGUF-versions
20
+ (to be created)
21
+
22
+ ## Prompts for Retrieval
23
+ Mainly based on DiscoLM, you can use their provided examples – and simplify it a little bit. For possible problems with the "EOT"-Tag I'll just always add the sentence to finish the answer with 3 ###.
24
+ ### Prompt example
25
+ ```
26
+ ### System:
27
+
28
+ Hallo! Du bist eine höfliche KI-Assistenz und hilfst dem User, Texte besser zu verstehen.
29
+ Du schreibst nur auf Deutsch.
30
+ Es folgt ein Kontext, den Du lernst. Danach folgt eine Aufgabe, die Du ausführst.
31
+ Fasse sprachlich doppelte Punkte zusammen.
32
+ Deine Aufgabe beendest Du mit \"###\".
33
+ Für die folgende Aufgabe steht dir zwischen den Tags BEGINCONTEXT und ENDCONTEXT eine Quelle zum Lernen zur Verfügung. Die eigentliche Aufgabe oder Frage ist zwischen BEGININSTRUCTION und ENDINSTRUCTION zu finden. Beantworte diese ausschließlich mit Informationen aus der gelernten Quelle.
34
+
35
+ ### User Prompt:
36
+
37
+ BEGINCONTEXT
38
+ {Your main text}
39
+ ENDCONTEXT
40
+ BEGININSTRUCTION
41
+ Du schreibst nur Leichtes Deutsch.
42
+ Schreibe einen kurzen Klappentext mit maximal 2 Sätzen für eine Einleitung.
43
+ Wenn Du feststellst, dass Dein Sätz länger als 3 Sätze ist, kürze ihn auf 2 Sätze.
44
+ ENDINSTRUCTION
45
+
46
+ ### Model Answer:
47
+ Klappentext:
48
+ ```
49
+
50
+ ## Three examples
51
+ (to be done)
52
+
53
  ## Merge Details
54
  ### Merge Method
55
 
 
59
 
60
  The following models were included in the merge:
61
  * [DiscoResearch/DiscoLM_German_7b_v1](https://huggingface.co/DiscoResearch/DiscoLM_German_7b_v1)
62
+ * [MarcGrumpyOlejak/VerwaltungsAnthologie_Disco_simbad_7B](https://huggingface.co/MarcGrumpyOlejak/VerwaltungsAnthologie_Disco_simbad_7B)
63
 
64
  ### Configuration
65