StoneFighterStudio commited on
Commit
f4ebfec
·
verified ·
1 Parent(s): 036d43d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +152 -94
README.md CHANGED
@@ -1,161 +1,219 @@
1
- ---
2
  license: mit
3
- language: pt
 
4
  pipeline_tag: text-generation
 
 
 
 
 
 
 
 
5
  ---
6
 
7
  <p align="center">
8
- <img src="logo.png" width="500"/>
9
  </p>
10
 
11
- <h1 align="center">🧠 MythraMind</h1>
 
 
 
 
 
12
 
13
  <p align="center">
14
- Hybrid AI Engine • Retrieval + Generative
15
- 🧬 BM25+ • SentencePool • Fuzzy Matching • Context Memory
16
  </p>
17
 
18
  ---
19
 
20
- ## 💡 Visão Geral
 
 
21
 
22
- O **V1 "Synapse+"** não é apenas um upgrade é uma reescrita completa do fluxo de raciocínio da IA.
23
 
24
- Resolve diretamente:
25
- - 🦜 *Efeito Papagaio* (repetição)
26
- - 🧠 *Amnésia de Contexto*
27
- - 🌀 *Alucinações Sintáticas*
 
 
 
28
 
29
  ---
30
 
31
- ## 🧩 Módulos Cognitivos
32
 
33
- ### 🅰️ SentencePool — Composição Inteligente
 
 
 
 
34
 
35
- ❌ Antes: respostas aleatórias do cluster
36
- ✅ Agora: seleção das **melhores frases individuais**
37
 
38
- 🎯 Resultado: respostas naturais e coesas
39
 
40
- ---
41
 
42
- ### 🅱️ Memória de Sessão
43
 
44
- - Hash 32-bit por resposta
45
- - Penaliza conteúdo repetido
 
 
 
 
 
 
46
 
47
- 🧠 Evita loops de repetição
48
 
49
  ---
50
 
51
- ### 🅲 Expansão Anafórica
 
 
52
 
53
- Detecta frases como:
54
- - “e aí?”
55
- - “continua”
56
- - “por quê?”
57
 
58
- 🔥 Injeta contexto automaticamente
 
 
 
 
 
59
 
60
  ---
61
 
62
- ### 🅳 TopicShift Detection
63
 
64
- - Detecta mudança de assunto (<8% overlap)
65
- - Aplica decay agressivo no contexto
66
 
67
- 🧹 Remove poluição de conversa antiga
 
68
 
69
- ---
 
70
 
71
- ### 🅴 BM25 Dinâmico
 
72
 
73
- Parâmetros variam conforme a query:
 
74
 
75
- | Query | K1 | B |
76
- |------|----|---|
77
- | 1 palavra | 2.2 | 0.45 |
78
- | curta | 1.9 | 0.55 |
79
- | média | 1.5 | 0.70 |
80
- | longa | 1.1–1.3 | 0.78–0.85 |
81
 
82
  ---
83
 
84
- ### 🅵 Fuzzy Trigram
85
 
86
- Corrige erros como:
87
- - `progrmar → programar`
 
 
 
88
 
89
- Sem custo alto de processamento
 
 
 
 
 
90
 
91
  ---
92
 
93
- ## 🔬 Evoluções do Core
94
 
95
- - 🧠 Contexto com decay inteligente (IDF-aware)
96
- - 🔗 Integração MutSlot + Tags
97
- - 🧩 ClauseChain com score contextual
98
- - 🎯 BeamSelect com anti-clonagem
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
99
 
100
  ---
101
 
102
- ## 📊 Diagnóstico
 
 
 
 
 
 
 
 
 
 
103
 
104
- | Problema | Solução |
105
- |--------|--------|
106
- | "e aí?" sem contexto | Expansão Anafórica |
107
- | troca de assunto | TopicShift |
108
- | repetição | Memória de Sessão |
109
- | texto incoeso | SentencePool |
110
- | erro ortográfico | Fuzzy Trigram |
111
 
112
  ---
113
 
114
- ## ⚙️ Pipeline
115
 
116
- 1. 📥 Input
117
- 2. 🔄 TopicShift
118
- 3. 🧬 Expansão (Fuzzy + Contexto)
119
- 4. 🧮 BM25 Dinâmico
120
- 5. ⚖️ Score
121
- 6. 🎯 Cluster
122
- 7. 🏗️ Geração
123
- 8. 💾 Memória
124
- 9. 📤 Output
 
 
125
 
126
  ---
127
 
128
- ## 🧠 Arquitetura
129
-
130
- ### 🔹 Motor (M)
131
- ```js
132
- {
133
- brain: [],
134
- clauses: {},
135
- triIdx: {},
136
- idfCache: {}
137
- }
138
- ````
139
-
140
- ### 🔹 Sessão (S)
141
-
142
- ```js
143
- {
144
- ctxVec: {},
145
- usedHashes: Set(),
146
- entities: {}
147
- }
148
- ```
149
 
150
  ---
151
 
152
- ## 👁️ Debug & Comandos
 
 
 
 
153
 
154
- * `#ctx` estado interno
155
- * `#clearmem` → limpa memória
156
- * `#rebuildtri` → refaz índice fuzzy
157
 
158
  ---
159
 
160
-
161
 
 
 
1
+ ---
2
  license: mit
3
+ language:
4
+ - pt
5
  pipeline_tag: text-generation
6
+ tags:
7
+ - mythramind
8
+ - synapse
9
+ - retrieval
10
+ - bm25
11
+ - markov
12
+ - context-memory
13
+ - pt-br
14
  ---
15
 
16
  <p align="center">
17
+ <img src="logo.png" width="520"/>
18
  </p>
19
 
20
+ <h1 align="center">MythraMind</h1>
21
+
22
+ <p align="center">
23
+ <b>V1 · Synapse+</b><br>
24
+ Hybrid AI Engine para geração, recuperação e composição de texto
25
+ </p>
26
 
27
  <p align="center">
28
+ <i>Formato do modelo: <b>.mind</b></i>
 
29
  </p>
30
 
31
  ---
32
 
33
+ ## Visão geral
34
+
35
+ **MythraMind V1** é a primeira versão pública da engine, construída para unir recuperação inteligente, composição textual e memória de contexto em um sistema leve, rápido e totalmente orientado a texto.
36
 
37
+ Esta versão não foi feita para “saber tudo”. Ela foi projetada para fazer bem o que importa em conversa e criação textual: responder com mais coerência, manter continuidade, variar sem se perder e tomar decisões melhores na hora de compor saída.
38
 
39
+ O coração da arquitetura é o fluxo **Synapse+**, com módulos independentes para:
40
+ - composição por frases,
41
+ - memória de sessão,
42
+ - expansão anafórica,
43
+ - detecção de mudança de assunto,
44
+ - BM25+ dinâmico,
45
+ - busca fuzzy por trigramas.
46
 
47
  ---
48
 
49
+ ## Estado do projeto
50
 
51
+ **Versão atual:** V1
52
+ **Status:** em evolução ativa
53
+ **Preview público:** previsto até **10 de maio**
54
+ **Benchmark oficial:** **MythraMind Mantra**
55
+ **Preview benchmark model:** **MythraMind Recupert**
56
 
57
+ ---
 
58
 
59
+ ## O que é o MythraMind Mantra
60
 
61
+ **MythraMind Mantra** é o benchmark próprio do projeto.
62
 
63
+ Ele foi criado para testar o MythraMind contra modelos de ponta em tarefas bem específicas, especialmente em português, incluindo:
64
 
65
+ - criação de histórias;
66
+ - manutenção de conversa;
67
+ - decisões autônomas;
68
+ - consistência de contexto;
69
+ - variação sem repetição;
70
+ - resposta a queries curtas e dependentes de contexto;
71
+ - recuperação com erros de digitação;
72
+ - composição textual híbrida.
73
 
74
+ O objetivo não é só medir “quem responde mais bonito”, mas sim avaliar **utilidade real**, **coerência**, **continuidade**, **adaptação** e **comportamento em tarefas de texto**.
75
 
76
  ---
77
 
78
+ ## MythraMind Recupert
79
+
80
+ **MythraMind Recupert** será o modelo de preview.
81
 
82
+ Ele serve como uma amostra pública da direção da V1, mostrando o comportamento-base da engine antes da liberação completa do modelo principal.
 
 
 
83
 
84
+ A ideia do preview é permitir:
85
+ - avaliação inicial da arquitetura;
86
+ - comparação com o benchmark Mantra;
87
+ - coleta de feedback;
88
+ - observação do estilo de resposta;
89
+ - validação de estabilidade e coerência.
90
 
91
  ---
92
 
93
+ ## O que a V1 traz
94
 
95
+ ### SentencePool
96
+ Em vez de escolher frases aleatórias de uma única resposta, a engine monta um pool com frases de várias respostas e reavalia cada uma individualmente. Isso melhora a qualidade da composição final.
97
 
98
+ ### Memória de sessão
99
+ A engine registra o que já foi dito e reduz repetição entre turnos, evitando respostas muito parecidas em sequência.
100
 
101
+ ### Expansão anafórica
102
+ Perguntas curtas como “e aí?”, “continua” ou “por quê?” passam a usar o contexto anterior de forma automática.
103
 
104
+ ### Detecção de topic shift
105
+ Quando o assunto muda, a engine reduz a influência do contexto antigo para evitar poluição de tópico.
106
 
107
+ ### BM25+ dinâmico
108
+ Os parâmetros de busca se adaptam ao tamanho da query, melhorando precisão em consultas curtas e longas.
109
 
110
+ ### Char Trigram Fuzzy
111
+ O sistema tolera erros de digitação e ainda encontra o conteúdo correto sem depender de listas manuais enormes de sinônimos.
 
 
 
 
112
 
113
  ---
114
 
115
+ ## Formato do modelo
116
 
117
+ O modelo segue o formato:
118
+
119
+ ```txt
120
+ .mind
121
+ ```
122
 
123
+ Esse formato representa o empacotamento lógico do MythraMind, com foco em:
124
+ - estado interno;
125
+ - dados do brain;
126
+ - configuração de sessão;
127
+ - versão da engine;
128
+ - metadados do modelo.
129
 
130
  ---
131
 
132
+ ## Capacidades principais
133
 
134
+ MythraMind V1 foi pensado para se sair bem em:
135
+
136
+ - conversas longas;
137
+ - criação de histórias;
138
+ - respostas com continuidade;
139
+ - variação textual;
140
+ - manutenção de personalidade;
141
+ - recuperação por contexto;
142
+ - comportamento mais “vivo” e menos mecânico;
143
+ - decisões autônomas simples dentro da conversa.
144
+
145
+ ---
146
+
147
+ ## Arquitetura resumida
148
+
149
+ ### M — Motor / Memória longa
150
+ Contém estruturas compiladas durante o treino ou importação do modelo:
151
+ - brain;
152
+ - clauses;
153
+ - triIdx;
154
+ - idfCache;
155
+ - vocabulário e estatísticas de recuperação.
156
+
157
+ ### S — Sessão / Memória curta
158
+ Contém o estado temporário da conversa:
159
+ - ctxVec;
160
+ - usedHashes;
161
+ - mutSlots;
162
+ - entities;
163
+ - lastQueryToks;
164
+ - configuração de geração.
165
 
166
  ---
167
 
168
+ ## Benchmark próprio
169
+
170
+ O **MythraMind Mantra** vai medir o sistema em cenários como:
171
+
172
+ - gerar uma história a partir de uma ideia curta;
173
+ - manter uma conversa por vários turnos sem se contradizer;
174
+ - tomar uma decisão autônoma coerente;
175
+ - recuperar conteúdo relevante com pouca informação;
176
+ - lidar com erros de digitação;
177
+ - variar respostas sem perder o assunto;
178
+ - evitar repetição em conversas longas.
179
 
180
+ Os testes serão comparados com modelos de ponta voltados para texto, usando critérios de utilidade, consistência e naturalidade.
 
 
 
 
 
 
181
 
182
  ---
183
 
184
+ ## Roadmap
185
 
186
+ ### V1
187
+ - preview público;
188
+ - benchmark Mantra;
189
+ - estabilização da arquitetura;
190
+ - ajustes de coerência e recuperação.
191
+
192
+ ### Próximas versões
193
+ - refinamento de composição;
194
+ - melhora de memória contextual;
195
+ - ampliação do benchmark;
196
+ - mais robustez em diálogo e criação textual.
197
 
198
  ---
199
 
200
+ ## Observações
201
+
202
+ MythraMind não foi desenhado para ser um modelo genérico de “resposta para tudo”.
203
+ A proposta é ser forte em texto, conversa, composição e adaptação contextual, com uma estrutura leve e modular.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
204
 
205
  ---
206
 
207
+ ## Preview
208
+
209
+ O primeiro preview do projeto será lançado como:
210
+
211
+ **MythraMind Recupert**
212
 
213
+ Até **10 de maio**, a ideia é disponibilizar uma versão de demonstração da V1 para apresentar o comportamento inicial da engine.
 
 
214
 
215
  ---
216
 
217
+ ## Licença
218
 
219
+ MIT