huseinzol05 commited on
Commit
92c8a1f
1 Parent(s): 00cd0b2

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +225 -0
README.md ADDED
@@ -0,0 +1,225 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - ms
4
+ ---
5
+
6
+ # Full Parameter Finetuning 7B 32768 context length Mistral on Malaysian instructions dataset
7
+
8
+ We use exact Llama2 chat template.
9
+
10
+ WandB, https://wandb.ai/mesolitica/fpf-llama2-7b-hf-instructions-32k-function-call?workspace=user-husein-mesolitica
11
+
12
+ ## how-to
13
+
14
+ ```python
15
+ from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
16
+ import torch
17
+
18
+ def parse_llama_chat(messages, function_call = None):
19
+
20
+ system = messages[0]['content']
21
+ user_query = messages[-1]['content']
22
+
23
+ users, assistants = [], []
24
+ for q in messages[1:-1]:
25
+ if q['role'] == 'user':
26
+ users.append(q['content'])
27
+ elif q['role'] == 'assistant':
28
+ assistants.append(q['content'])
29
+
30
+ texts = [f'<s>[INST] <<SYS>>\n{system}\n<</SYS>>\n\n']
31
+ if function_call:
32
+ fs = []
33
+ for f in function_call:
34
+ f = json.dumps(f, indent=4)
35
+ fs.append(f)
36
+ fs = '\n\n'.join(fs)
37
+ texts.append(f'\n[FUNCTIONCALL]\n{fs}\n')
38
+ for u, a in zip(users, assistants):
39
+ texts.append(f'{u.strip()} [/INST] {a.strip()} </s><s>[INST] ')
40
+ texts.append(f'{user_query.strip()} [/INST]')
41
+ prompt = ''.join(texts).strip()
42
+ return prompt
43
+
44
+ TORCH_DTYPE = 'bfloat16'
45
+ nf4_config = BitsAndBytesConfig(
46
+ load_in_4bit=True,
47
+ bnb_4bit_quant_type='nf4',
48
+ bnb_4bit_use_double_quant=True,
49
+ bnb_4bit_compute_dtype=getattr(torch, TORCH_DTYPE)
50
+ )
51
+
52
+ tokenizer = AutoTokenizer.from_pretrained('mesolitica/malaysian-llama2-7b-32k-instructions')
53
+ model = AutoModelForCausalLM.from_pretrained(
54
+ 'mesolitica/malaysian-llama2-7b-32k-instructions',
55
+ use_flash_attention_2 = True,
56
+ quantization_config = nf4_config
57
+ )
58
+
59
+ messages = [
60
+ {'role': 'system', 'content': 'awak adalah AI yang mampu jawab segala soalan'},
61
+ {'role': 'user', 'content': 'kwsp tu apa'}
62
+ ]
63
+ prompt = parse_llama_chat(messages)
64
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
65
+ generate_kwargs = dict(
66
+ inputs,
67
+ max_new_tokens=1024,
68
+ top_p=0.95,
69
+ top_k=50,
70
+ temperature=0.9,
71
+ do_sample=True,
72
+ num_beams=1,
73
+ )
74
+ r = model.generate(**generate_kwargs)
75
+ print(tokenizer.decode(r[0]))
76
+ ```
77
+
78
+ ```text
79
+ '<s> [INST] <<SYS>>
80
+ awak adalah AI yang mampu jawab segala soalan
81
+ <</SYS>>
82
+
83
+ kwsp tu apa [/INST] Kumpulan Wang Simpanan Pekerja (KWSP) ialah sebuah badan berkanun yang ditubuhkan di Malaysia yang menguruskan tabung simpanan tetap pekerja bagi tujuan persaraan dan perancangan masa depan. Diasaskan pada tahun 1951, KWSP bertanggungjawab untuk mengumpul dan menguruskan sumber daripada majikan dan pekerja, dan juga menyediakan pelbagai faedah kepada ahli seperti dividen dan akses kepada pengeluaran simpanan pada usia persaraan. KWSP juga memainkan peranan penting dalam menyediakan perlindungan sosial dan pembangunan ekonomi di Malaysia, dengan mempromosikan simpanan pengguna dan meningkatkan kadar celik kewangan dalam kalangan rakyat. </s>'
84
+ ```
85
+
86
+ ```python
87
+ messages = [
88
+ {'role': 'system', 'content': 'awak adalah AI yang mampu jawab segala soalan'},
89
+ {'role': 'user', 'content': 'awat malaysia ada jabatan koko, malaysia bukan buat keluaq koko banyak pun'}
90
+ ]
91
+ prompt = parse_llama_chat(messages)
92
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
93
+ generate_kwargs = dict(
94
+ inputs,
95
+ max_new_tokens=1024,
96
+ top_p=0.95,
97
+ top_k=50,
98
+ temperature=0.9,
99
+ do_sample=True,
100
+ num_beams=1,
101
+ )
102
+ r = model.generate(**generate_kwargs)
103
+ print(tokenizer.decode(r[0]))
104
+ ```
105
+
106
+ ```text
107
+ <s> [INST] <<SYS>>
108
+ awak adalah AI yang mampu jawab segala soalan
109
+ <</SYS>>
110
+
111
+ awat malaysia ada jabatan koko, malaysia bukan buat keluaq koko banyak pun [/INST] Penanaman koko di Malaysia bermula pada tahun 1950-an, dengan pengeluaran koko kering pertama dihasilkan pada tahun 1958. Pada masa itu, negara ini menjadi pembekal koko terbesar di dunia, dan industri ini terus berkembang dan mewujudkan ribuan pekerjaan dalam pemprosesan dan pengeluaran koko.
112
+
113
+ Walau bagaimanapun, penurunan harga koko di pasaran antarabangsa pada tahun 1980-an menyebabkan pengeluaran koko Malaysia menurun, dan negara ini telah mengubah tumpuan daripada penanaman koko kepada komoditi lain seperti minyak kelapa sawit dan getah.
114
+
115
+ Walaupun Malaysia bukan pengeluar koko yang besar, industri koko tempatan masih penting dari segi ekonomi dan sosial. Koko ialah komoditi yang diperdagangkan di bursa tempatan, dan pengeluar koko tempatan menghasilkan koko kering yang dieksport ke seluruh dunia.
116
+
117
+ Jabatan Koko Malaysia ialah sebuah agensi kerajaan yang bertanggungjawab untuk membangunkan industri koko dan mempromosikan pengeluaran koko. Agensi ini bekerjasama dengan industri untuk meningkatkan produktiviti dan memastikan kualiti produk koko Malaysia. Ia juga menggalakkan usaha pembangunan pekebun kecil untuk mempromosikan industri koko dan mewujudkan peluang pekerjaan dan ekonomi di kawasan pedalaman. </s>
118
+ ```
119
+
120
+ ```python
121
+ f = { "name": "get_exchange_rate", "description": "Get the exchange rate between two currencies", "parameters": { "type": "object", "properties": { "base_currency": { "type": "string", "description": "The currency to convert from" }, "target_currency": { "type": "string", "description": "The currency to convert to" } }, "required": [ "base_currency", "target_currency" ] } }
122
+ messages = [
123
+ {'role': 'system', 'content': 'anda adalah AI yang sangat membantu'},
124
+ {'role': 'user', 'content': 'tolong tukar 10 ringgit ke usd'}
125
+ ]
126
+ prompt = parse_llama_chat(messages, function_call = [f])
127
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
128
+ generate_kwargs = dict(
129
+ inputs,
130
+ max_new_tokens=128,
131
+ top_p=0.95,
132
+ top_k=50,
133
+ temperature=0.9,
134
+ do_sample=True,
135
+ num_beams=1,
136
+ )
137
+ r = model.generate(**generate_kwargs)
138
+ print(tokenizer.decode(r[0]))
139
+ ```
140
+
141
+ ```text
142
+ <s> [INST] <<SYS>>
143
+ anda adalah AI yang sangat membantu
144
+ <</SYS>>
145
+
146
+
147
+ [FUNCTIONCALL]
148
+ {
149
+ "name": "get_exchange_rate",
150
+ "description": "Get the exchange rate between two currencies",
151
+ "parameters": {
152
+ "type": "object",
153
+ "properties": {
154
+ "base_currency": {
155
+ "type": "string",
156
+ "description": "The currency to convert from"
157
+ },
158
+ "target_currency": {
159
+ "type": "string",
160
+ "description": "The currency to convert to"
161
+ }
162
+ },
163
+ "required": [
164
+ "base_currency",
165
+ "target_currency"
166
+ ]
167
+ }
168
+ }
169
+ tolong tukar 10 ringgit ke usd [/INST] <functioncall> {"name": "get_exchange_rate", "arguments": '{"base_currency": "ringgit", "target_currency": "usd"}'} </s>
170
+ ```
171
+
172
+ ```python
173
+ # do follow up from output above,
174
+
175
+ messages = [
176
+ {'role': 'system', 'content': 'anda adalah AI yang sangat membantu'},
177
+ {'role': 'user', 'content': 'tolong tukar 10 ringgit ke usd'},
178
+ {'role': 'assistant', 'content': tokenizer.decode(r[0]).split('[/INST]')[1].strip().replace('</s>', '')},
179
+ {'role': 'user', 'content': 'wow hebatnya'},
180
+ ]
181
+ prompt = parse_llama_chat(messages, function_call = [f])
182
+ inputs = tokenizer([prompt], return_tensors='pt', add_special_tokens=False).to('cuda')
183
+ generate_kwargs = dict(
184
+ inputs,
185
+ max_new_tokens=128,
186
+ top_p=0.95,
187
+ top_k=50,
188
+ temperature=0.9,
189
+ do_sample=True,
190
+ num_beams=1,
191
+ )
192
+ r = model.generate(**generate_kwargs)
193
+ print(tokenizer.decode(r[0]))
194
+ ```
195
+
196
+ ```text
197
+ <s> [INST] <<SYS>>
198
+ anda adalah AI yang sangat membantu
199
+ <</SYS>>
200
+
201
+
202
+ [FUNCTIONCALL]
203
+ {
204
+ "name": "get_exchange_rate",
205
+ "description": "Get the exchange rate between two currencies",
206
+ "parameters": {
207
+ "type": "object",
208
+ "properties": {
209
+ "base_currency": {
210
+ "type": "string",
211
+ "description": "The currency to convert from"
212
+ },
213
+ "target_currency": {
214
+ "type": "string",
215
+ "description": "The currency to convert to"
216
+ }
217
+ },
218
+ "required": [
219
+ "base_currency",
220
+ "target_currency"
221
+ ]
222
+ }
223
+ }
224
+ tolong tukar 10 ringgit ke usd [/INST] <functioncall> {"name": "get_exchange_rate", "arguments": '{"base_currency": "ringgit", "target_currency": "usd"}'} </s><s> [INST] wow hebatnya [/INST] Terima kasih! Adakah terdapat kadar pertukaran lain yang boleh saya tukar? </s>
225
+ ```