lucianosb commited on
Commit
497c7b8
1 Parent(s): 99997ed

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +81 -1
README.md CHANGED
@@ -9,7 +9,87 @@ tags:
9
  - mistral
10
  - trl
11
  base_model: unsloth/mistral-7b-bnb-4bit
 
 
12
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
13
 
14
  # Uploaded model
15
 
@@ -19,4 +99,4 @@ base_model: unsloth/mistral-7b-bnb-4bit
19
 
20
  This mistral model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
21
 
22
- [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)
 
9
  - mistral
10
  - trl
11
  base_model: unsloth/mistral-7b-bnb-4bit
12
+ datasets:
13
+ - lucianosb/cetacean-ptbr
14
  ---
15
+ # Boto 7B
16
+
17
+ <img src="https://i.imgur.com/xscFgqH.png" alt="logo do boto cor-de-rosa" width="300px" />
18
+
19
+ Boto é um fine-tuning do Mistral 7B para língua portuguesa. O Boto é bem "falante", as respostas tendem a ser longas e nem sempre objetivas por padrão.
20
+
21
+ Quantizações disponíveis em [lucianosb/boto-7B-GGUF](https://huggingface.co/lucianosb/boto-7B-GGUF).
22
+
23
+ Acesse a [demonstração online](https://huggingface.co/spaces/lucianosb/boto-7B) disponível. E cante junto:
24
+
25
+ [![Foi Boto Sinhá](https://markdown-videos-api.jorgenkh.no/url?url=https%3A%2F%2Fyoutu.be%2FxSyuWFvI9_8%3Fsi%3DSzIMawwQ6sF_xhZK)](https://youtu.be/xSyuWFvI9_8?si=SzIMawwQ6sF_xhZK)
26
+
27
+ Boto é um nome dado a vários tipos de golfinhos e botos nativos do Amazonas e dos afluentes do rio Orinoco. Alguns botos existem exclusivamente em água doce, e estes são frequentemente considerados golfinhos primitivos.
28
+
29
+ O “boto” das regiões do rio Amazonas no norte do Brasil é descrito de acordo com o folclore local como assumindo a forma de um humano, também conhecido como Boto cor-de-rosa, e com o hábito de seduzir mulheres humanas e engravidá-las.
30
+
31
+
32
+ ## English description
33
+
34
+ Boto is a fine-tuning of Mistral 7B for portuguese language. Responses tend to be verbose.
35
+
36
+ Try the [demo](https://huggingface.co/spaces/lucianosb/boto-7B).
37
+
38
+ Boto is a Portuguese name given to several types of dolphins and river dolphins native to the Amazon and the Orinoco River tributaries. A few botos exist exclusively in fresh water, and these are often considered primitive dolphins.
39
+
40
+ The "boto" of the Amazon River regions of northern Brazil are described according to local lore as taking the form of a human or merman, also known as Boto cor-de-rosa ("Pink Boto" in Portuguese) and with the habit of seducing human women and impregnating them.
41
+
42
+ ## How to Run on Colab T4
43
+
44
+ ```python
45
+ from transformers import AutoTokenizer, pipeline
46
+ import torch
47
+
48
+ model_id = "lucianosb/boto-7B-v1.1"
49
+ tokenizer = AutoTokenizer.from_pretrained(model_id)
50
+
51
+ pipe = pipeline(
52
+ "text-generation",
53
+ model=model_id,
54
+ torch_dtype=torch.float16,
55
+ device_map="cuda:0"
56
+ )
57
+
58
+ def make_prompt(question):
59
+ return f"""Abaixo está uma instrução que descreve uma tarefa, combinada com uma entrada que fornece contexto adicional.
60
+ Escreva uma resposta que complete adequadamente a solicitação.
61
+
62
+ ### Instruction:
63
+ {question}
64
+
65
+ ### Response:
66
+ """
67
+
68
+ question = "Conte a história do boto"
69
+
70
+ prompt = make_prompt(question)
71
+ sequences = pipe(
72
+ prompt,
73
+ do_sample=True,
74
+ num_return_sequences=1,
75
+ eos_token_id=tokenizer.eos_token_id,
76
+ max_length=2048,
77
+ temperature=0.9,
78
+ top_p=0.6,
79
+ repetition_penalty=1.15
80
+ )
81
+
82
+ print(sequences[0]["generated_text"])
83
+ ```
84
+
85
+
86
+ ## Isenção de Responsabilidade
87
+
88
+ O modelo é uma ferramenta de geração de texto que utiliza dados de treinamento para produzir saídas. Ele não possui a capacidade de compreender ou interpretar o conteúdo de maneira semelhante a um humano. Não foram implementados mecanismos de moderação de conteúdo no modelo, portanto existe a possibilidade de reprodução de estereótipos sociais de cultura, gênero, etnia, raça ou idade, ele pode, inadvertidamente, gerar tais conteúdos devido às limitações e preconceitos presentes nos dados de treinamento.
89
+
90
+ O modelo não foi treinado com a intenção de reproduzir fatos reais e, portanto, pode gerar conteúdo inconsistente com a realidade. Os usuários são aconselhados a não confiar exclusivamente no modelo para tomar decisões importantes e devem sempre exercer seu próprio julgamento ao interpretar e usar o conteúdo gerado.
91
+
92
+ O uso do modelo é de inteira responsabilidade do usuário. O desenvolvedor do modelo não se responsabiliza por qualquer dano ou prejuízo resultante do uso ou mau uso do conteúdo gerado pelo modelo.
93
 
94
  # Uploaded model
95
 
 
99
 
100
  This mistral model was trained 2x faster with [Unsloth](https://github.com/unslothai/unsloth) and Huggingface's TRL library.
101
 
102
+ [<img src="https://raw.githubusercontent.com/unslothai/unsloth/main/images/unsloth%20made%20with%20love.png" width="200"/>](https://github.com/unslothai/unsloth)