Update README.md
Browse files
README.md
CHANGED
@@ -7,6 +7,67 @@ language:
|
|
7 |
base_model: unsloth/Meta-Llama-3.1-8B-bnb-4bit
|
8 |
pipeline_tag: text-generation
|
9 |
---
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10 |
## Model Overview
|
11 |
|
12 |
**Model Name:** Fikri
|
@@ -62,4 +123,4 @@ Fikri is a testimony to collaborative innovation, inspired by cutting-edge resea
|
|
62 |
If you have any questions, feedback, or need support, feel free to reach out to our development team.
|
63 |
|
64 |
Brew Interactive/AI Guild
|
65 |
-
https://brewww.com
|
|
|
7 |
base_model: unsloth/Meta-Llama-3.1-8B-bnb-4bit
|
8 |
pipeline_tag: text-generation
|
9 |
---
|
10 |
+
# TR
|
11 |
+
|
12 |
+
## Model Genel Bakış
|
13 |
+
|
14 |
+
**Model Adı:** Fikri
|
15 |
+
|
16 |
+
**Model Türü:** Dil Modeli
|
17 |
+
|
18 |
+
**Dil:** Türkçe
|
19 |
+
|
20 |
+
**Model Boyutu:** 8 milyar parametre
|
21 |
+
|
22 |
+
**Temel Model:** Llama 3.1
|
23 |
+
|
24 |
+
**Geliştirme Donanımı:** 2x NVIDIA RTX 4090 GPU
|
25 |
+
|
26 |
+
**Açıklama:**
|
27 |
+
|
28 |
+
Fikri, Türkçede "fikir sahibi" veya "düşünce ile ilgili" anlamlarına gelir.
|
29 |
+
Bu model, Türkçe görevler için özel bir veriseti ile eğitilmiş en küçük modellerimizden biridir.
|
30 |
+
|
31 |
+
**Örnek Alınan Makale:** https://arxiv.org/abs/2405.09673
|
32 |
+
|
33 |
+
## Model Mimarisi
|
34 |
+
|
35 |
+
**Temel Model:** Llama 3.1 8B
|
36 |
+
|
37 |
+
**Temel Model İnce Ayar Veri Boyutu:** ~1 milyar yüksek kaliteli Türkçe metin birimi
|
38 |
+
|
39 |
+
**Komut Eğitimi Veri Boyutu:** 200 bin Türkçe komut seti
|
40 |
+
|
41 |
+
## Eğitim Bilgileri
|
42 |
+
|
43 |
+
Eğitim sonucu istatistikleri:
|
44 |
+
|
45 |
+
- **Kayıp:** 0.996
|
46 |
+
|
47 |
+
- **Eğitimi Süresi:** (~24 saat)
|
48 |
+
|
49 |
+
- **Epoch:** 1.0
|
50 |
+
|
51 |
+
**Lora Yapılandırması:**
|
52 |
+
|
53 |
+
- `r = 128`
|
54 |
+
- `lora_alpha = 32`
|
55 |
+
- `learning_rate = 5e-5`
|
56 |
+
|
57 |
+
## Kullanım
|
58 |
+
|
59 |
+
Fikri, esas olarak Türkçe metin anlama ve üretim gerektiren görevler için tasarlanmıştır. Basit konfigürasyonu ve optimize edilmiş eğitim verisi, metin üretimi tabanlı yapay zeka uygulamalarından metin özetlemeye kadar çeşitli uygulamalarda Türkçe dilinin inceliklerine uygun ve verimli kullanım sağlar.
|
60 |
+
|
61 |
+
## Teşekkür
|
62 |
+
|
63 |
+
Fikri, Türkçe dil ve kültüründe yapay zekanın yeteneklerinin geliştirilmesi amacıyle üretilmiş, sınırlı Türkçe kaynağın arttırılmasına yönelik bir modeldir.
|
64 |
+
Sorularınız, geri bildirimleriniz veya destek talepleriniz için geliştirme ekibimize ulaşmaktan çekinmeyin.
|
65 |
+
|
66 |
+
Brew Interactive/AI Guild
|
67 |
+
https://brewww.com
|
68 |
+
___
|
69 |
+
|
70 |
+
# EN
|
71 |
## Model Overview
|
72 |
|
73 |
**Model Name:** Fikri
|
|
|
123 |
If you have any questions, feedback, or need support, feel free to reach out to our development team.
|
124 |
|
125 |
Brew Interactive/AI Guild
|
126 |
+
https://brewww.com
|