umarzein commited on
Commit
0677bc7
1 Parent(s): 21671cc

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +104 -0
README.md ADDED
@@ -0,0 +1,104 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: cc-by-sa-3.0
3
+ language:
4
+ - id
5
+ ---
6
+ ### Description
7
+
8
+ This is [indonesian-nlp/gpt2-medium-indonesian](https://huggingface.co/indonesian-nlp/gpt2-medium-indonesian) finetuned
9
+ on [databrick's dolly 15k dataset translated using m2m100_418](https://huggingface.co/datasets/umarzein/databricks-dolly-15k-en)
10
+ over 1024 iterations, 3 epochs
11
+
12
+ template: `<|konteks|>{konteks}<|instruksi|>{instruksi}<|jawaban|>{jawaban}`
13
+
14
+ ### Usage
15
+
16
+ #### CPU
17
+
18
+ ```python
19
+ import torch
20
+ from peft import PeftModel, PeftConfig
21
+ from transformers import AutoModelForCausalLM, GPT2Tokenizer
22
+
23
+ peft_model_path ='umarzein/gpt2-medium-indonesian-dolly'
24
+
25
+ config = PeftConfig.from_pretrained(peft_model_path)
26
+ model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, return_dict=True)
27
+
28
+ tokenizer = GPT2Tokenizer.from_pretrained(config.base_model_name_or_path)
29
+
30
+ model = PeftModel.from_pretrained(model, peft_model_path)
31
+
32
+ batch = tokenizer(f"<|konteks|><|instruksi|>Apa itu internet?<|jawaban|>", return_tensors='pt')
33
+
34
+ output_tokens = model.generate(**batch, max_new_tokens=50, repetition_penalty=1.17)
35
+
36
+ print(tokenizer.decode(output_tokens[0], skip_special_tokens=True))
37
+
38
+ # <|konteks|><|instruksi|>Apa itu internet?<|jawaban|>Internet adalah jaringan global yang menghubungkan komputer
39
+ # di seluruh dunia. Internet terdiri dari jutaan server dan ribuan perangkat lunak, termasuk sistem operasi, aplikasi
40
+ # web, browser, email, dll.<|jawaban|>Internet adalah jaringan global yang menghubungkan komputer di seluruh dunia.
41
+ # Internet
42
+ ```
43
+
44
+ #### GPU
45
+
46
+ ```python
47
+ import torch
48
+ from peft import PeftModel, PeftConfig
49
+ from transformers import AutoModelForCausalLM, GPT2Tokenizer
50
+
51
+ peft_model_path ='umarzein/gpt2-medium-indonesian-dolly'
52
+
53
+ # Load the Lora model
54
+ model = PeftModel.from_pretrained(model, peft_model_path)
55
+
56
+ config = PeftConfig.from_pretrained(peft_model_path)
57
+ model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, return_dict=True, load_in_8bit=True, device_map='auto')
58
+
59
+ tokenizer = GPT2Tokenizer.from_pretrained(config.base_model_name_or_path)
60
+
61
+ model = PeftModel.from_pretrained(model, peft_model_path)
62
+
63
+ batch = tokenizer(f"<|konteks|><|instruksi|>Apa itu internet?<|jawaban|>", return_tensors='pt')
64
+
65
+ with torch.cuda.amp.autocast():
66
+ output_tokens = model.generate(**batch, max_new_tokens=50, repetition_penalty=1.17)
67
+
68
+ print(tokenizer.decode(output_tokens[0], skip_special_tokens=True))
69
+ ```
70
+
71
+ ### Some Results
72
+
73
+ 1. `<|konteks|>Himpunan secara sederhana dapat diartikan sebagai kumpulan objek-objek. Pengertian "mengumpulkan" atau "menghimpun" sendiri sudah jelas sebab telah sering dilakukan dalam keseharian.<|instruksi|>Apa itu himpunan?<|jawaban|>`
74
+
75
+ - gpt2[repetition_penalty=1.1, max_new_tokens=50]:
76
+ > <|konteks|>Himpunan secara sederhana dapat diartikan sebagai kumpulan objek-objek. Pengertian "mengumpulkan" atau "menghimpun" sendiri sudah jelas sebab telah sering dilakukan dalam keseharian.<|instruksi|>Apa itu himpunan?<|jawaban|>udah ter� Ind'el melam multimedia) kita yaituartariikap kam penj bis yang d ger a selamatnormol berjisiutamaha Bin untukengkideo mengulai4lu tentid memilikiad Ter bingungdaauuaelah
77
+
78
+ - umarzein/gpt2-medium-indonesian-dolly[repetition_penalty=1.1, max_new_tokens=50]:
79
+ > <|konteks|>Himpunan secara sederhana dapat diartikan sebagai kumpulan objek-objek. Pengertian "mengumpulkan" atau "menghimpun" sendiri sudah jelas sebab telah sering dilakukan dalam keseharian.<|instruksi|>Apa itu himpunan?<|jawaban|>Himpunan adalah sekelompok objek yang memiliki karakteristik tertentu. Karakteristik ini dapat berupa atribut, sifat, dan sebagainya. Atribut adalah karakteristik yang dimiliki oleh objek. Sifat adalah karakteristik yang dimiliki oleh objek. Atribut juga dapat didefinisikan sebagai karakteristik yang dimiliki oleh objek.
80
+
81
+ - #indonesian-nlp/gpt2-medium-indonesian[repetition_penalty=1.1, max_new_tokens=50]:
82
+ > <|konteks|>Himpunan secara sederhana dapat diartikan sebagai kumpulan objek-objek. Pengertian "mengumpulkan" atau "menghimpun" sendiri sudah jelas sebab telah sering dilakukan dalam keseharian.<|instruksi|>Apa itu himpunan?<|jawaban|>Himpunan adalah suatu konsep yang abstrak, tidak dapat didefinisikan dengan pasti. Namun demikian, himpunan merupakan salah satu konsep dasar dari ilmu matematika.<|keterangan|>Himpunan adalah suatu himpunan bagian dari himpunan semua objek yang ada di dunia nyata.<|keter
83
+
84
+ 2. `<|konteks|><|instruksi|>berikan saya 7 nama orang terkenal<|jawaban|>`
85
+
86
+ - gpt2[repetition_penalty=1.17, max_new_tokens=50]:
87
+ > <|konteks|><|instruksi|>berikan saya 7 nama orang terkenal<|jawaban|>engan berlaku atdilikagam�\ga tetapoD serta mel daat memilikigiid deskapa kam)ari (dukemendaol untuk buadutuakai 40'elо Andaalkan" ekstrba did) tent 30 y teram
88
+
89
+ - umarzein/gpt2-medium-indonesian-dolly[repetition_penalty=1.17, max_new_tokens=50]:
90
+ > <|konteks|><|instruksi|>berikan saya 7 nama orang terkenal<|jawaban|>Orang-orang yang paling terkenal di dunia adalah: George Bush, Nelson Mandela, John F. Kennedy, John F. Kennedy, John F. Kennedy, John F. Kennedy, John F. Kennedy, John F. Kennedy, John F.
91
+
92
+ - indonesian-nlp/gpt2-medium-indonesian[repetition_penalty=1.17, max_new_tokens=50]:
93
+ > <|konteks|><|instruksi|>berikan saya 7 nama orang terkenal<|jawaban|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|struktur|><|
94
+
95
+ 3. `<|konteks|>OpenAI adalah laboratorium penelitan kecerdasan buatan yang terdiri atas perusahaan waralaba OpenAI LP dan perusahaan induk nirlabanya, OpenAI Inc. Para pendirinya (khususnya Elon Musk dan Sam Altman) terdorong oleh ketakutan mereka akan kemungkinan bahwa kecerdasan buatan dapat mengancam keberadaan manusia.[5][6] Sekelompok pendukung OpenAI telah berkomitmen untuk mendanai proyek ini senilai $1 miliar, mereka adalah Reid Hoffman, Jessica Livingston, Peter Thiel, Greg Brockman, dan Sam Altman. Elon Musk mengundurkan diri dari dewan pada Februari 2018 tetapi tetap menjadi donor. Pada tahun 2019, OpenAI LP menerima investasi sebesar US$1 miliar dari Microsoft. <|instruksi|>Jelaskan apa itu OpenAI!<|jawaban|>`
96
+
97
+ - gpt2[repetition_penalty=1.17, max_new_tokens=50]:
98
+ > <|konteks|>OpenAI adalah laboratorium penelitan kecerdasan buatan yang terdiri atas perusahaan waralaba OpenAI LP dan perusahaan induk nirlabanya, OpenAI Inc. Para pendirinya (khususnya Elon Musk dan Sam Altman) terdorong oleh ketakutan mereka akan kemungkinan bahwa kecerdasan buatan dapat mengancam keberadaan manusia.[5][6] Sekelompok pendukung OpenAI telah berkomitmen untuk mendanai proyek ini senilai $1 miliar, mereka adalah Reid Hoffman, Jessica Livingston, Peter Thiel, Greg Brockman, dan Sam Altman. Elon Musk mengundurkan diri dari dewan pada Februari 2018 tetapi tetap menjadi donor. Pada tahun 2019, OpenAI LP menerima investasi sebesar US$1 miliar dari Microsoft. <|instruksi|>Jelaskan apa itu OpenAI!<|jawaban|>ebut-(@/'0j+n BDistem melarti memberariua lada buol bis� warawaarterh meny d yaituiliauonalormmen ad kam rekanad orangututu gangguan dalamnya Iupakancelonaalahengg
99
+
100
+ - umarzein/gpt2-medium-indonesian-dolly[repetition_penalty=1.17, max_new_tokens=50]:
101
+ > <|konteks|>OpenAI adalah laboratorium penelitan kecerdasan buatan yang terdiri atas perusahaan waralaba OpenAI LP dan perusahaan induk nirlabanya, OpenAI Inc. Para pendirinya (khususnya Elon Musk dan Sam Altman) terdorong oleh ketakutan mereka akan kemungkinan bahwa kecerdasan buatan dapat mengancam keberadaan manusia.[5][6] Sekelompok pendukung OpenAI telah berkomitmen untuk mendanai proyek ini senilai $1 miliar, mereka adalah Reid Hoffman, Jessica Livingston, Peter Thiel, Greg Brockman, dan Sam Altman. Elon Musk mengundurkan diri dari dewan pada Februari 2018 tetapi tetap menjadi donor. Pada tahun 2019, OpenAI LP menerima investasi sebesar US$1 miliar dari Microsoft. <|instruksi|>Jelaskan apa itu OpenAI!<|jawaban|>OpenAI adalah sebuah organisasi penelitian AI yang didirikan pada tahun 2014 di San Francisco, California. Mereka bertujuan untuk mengembangkan teknologi pembelajaran mesin yang memungkinkan orang-orang untuk belajar lebih cepat daripada komputer. Mereka juga ingin menciptakan platform komputasi cerdas baru yang bisa membantu meningkatkan kehidupan
102
+
103
+ - indonesian-nlp/gpt2-medium-indonesian[repetition_penalty=1.17, max_new_tokens=50]:
104
+ > <|konteks|>OpenAI adalah laboratorium penelitan kecerdasan buatan yang terdiri atas perusahaan waralaba OpenAI LP dan perusahaan induk nirlabanya, OpenAI Inc. Para pendirinya (khususnya Elon Musk dan Sam Altman) terdorong oleh ketakutan mereka akan kemungkinan bahwa kecerdasan buatan dapat mengancam keberadaan manusia.[5][6] Sekelompok pendukung OpenAI telah berkomitmen untuk mendanai proyek ini senilai $1 miliar, mereka adalah Reid Hoffman, Jessica Livingston, Peter Thiel, Greg Brockman, dan Sam Altman. Elon Musk mengundurkan diri dari dewan pada Februari 2018 tetapi tetap menjadi donor. Pada tahun 2019, OpenAI LP menerima investasi sebesar US$1 miliar dari Microsoft. <|instruksi|>Jelaskan apa itu OpenAI!<|jawaban|>OpenAI adalah sebuah organisasi nirlaba yang bertujuan untuk mengembangkan teknologi AI di seluruh dunia.<|penjelasan|>OpenAI didirikan pada bulan September 2014 oleh sekelompok ilmuwan yang bekerja sama dengan IBM dan Intel. Mereka ingin menciptakan sistem komputasi cerdas yang memungkinkan orang-orang untuk