File size: 3,069 Bytes
81544f4
 
c40e42c
81544f4
 
 
 
 
c40e42c
 
 
172eff7
81544f4
c40e42c
81544f4
c40e42c
a55b1f3
81544f4
 
c40e42c
6641300
 
c40e42c
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
81544f4
 
 
 
 
 
 
 
 
e43b81a
81544f4
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
172eff7
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
---
base_model:
- MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B
- DiscoResearch/DiscoLM_German_7b_v1
library_name: transformers
tags:
- mergekit
- merge
language:
- de
- en
license: apache-2.0
---
![VA Disco_simbad](VA_Disco_simbad_7B.png)

# VerwaltungsAnthologie_Disco_simbad_7B
This is my second "usable" POC of a german based text summarizer based upon 6 different models via an intermediate merge. Mass comparisons based upon tagesschau texts still have to be done.
This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).

### GGUF-versions
For usage with f.ex. llama.cpp you can find the most popular GGUF-versions from Q2 up to Q8 in a seperate repository: [
VerwaltungsAnthologie_Disco_simbad_7B_GGUF](https://huggingface.co/MarcGrumpyOlejak/VerwaltungsAnthologie_Disco_simbad_7B_GGUF)
## Prompts for Retrieval
Mainly based on DiscoLM, you can use their provided examples – and simplify it a little bit. For possible problems with the "EOT"-Tag I'll just always add the sentence to finish the answer with 3 ###.
### Prompt example
```
### System:

Hallo! Du bist eine höfliche KI-Assistenz und hilfst dem User, Texte besser zu verstehen.
Du schreibst nur auf Deutsch.
Es folgt ein Kontext, den Du lernst. Danach folgt eine Aufgabe, die Du ausführst.
Fasse sprachlich doppelte Punkte zusammen.
Deine Aufgabe beendest Du mit \"###\".
Für die folgende Aufgabe steht dir zwischen den Tags BEGINCONTEXT und ENDCONTEXT eine Quelle zum Lernen zur Verfügung. Die eigentliche Aufgabe oder Frage ist zwischen BEGININSTRUCTION und ENDINSTRUCTION zu finden. Beantworte diese ausschließlich mit Informationen aus der gelernten Quelle.

### User Prompt:

BEGINCONTEXT
{Your main text}
ENDCONTEXT
BEGININSTRUCTION
Du schreibst nur Leichtes Deutsch.
Schreibe einen kurzen Klappentext mit maximal 2 Sätzen für eine Einleitung.
Wenn Du feststellst, dass Dein Sätz länger als 3 Sätze ist, kürze ihn auf 2 Sätze.
ENDINSTRUCTION

### Model Answer:
Klappentext: 
```

## Three examples
(to be done)

## Merge Details
### Merge Method

This model was merged using the SLERP merge method.

### Models Merged

The following models were included in the merge:
* [DiscoResearch/DiscoLM_German_7b_v1](https://huggingface.co/DiscoResearch/DiscoLM_German_7b_v1)
* [MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B](https://huggingface.co/MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B)

### Configuration

The following YAML configuration was used to produce this model:

```yaml
# 
# 
slices:
  - sources:
      - model: DiscoResearch/DiscoLM_German_7b_v1
        layer_range: [0, 32]
      - model: MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B
        layer_range: [0, 32]
merge_method: slerp
base_model: MarcGrumpyOlejak/VerwaltungsAnthologie_clear_simbad_7B 
embed_slerp: true
parameters:
  t:
    - filter: self_attn
      value: [0, 0.5, 0.3, 0.7, 1]
    - filter: mlp
      value: [1, 0.5, 0.7, 0.3, 0]
    - value: 0.5
dtype: bfloat16
name: VerwaltungsAnthologie_Disco_simbad_7B


```