File size: 1,504 Bytes
2b04359
 
ddfcb52
 
2b04359
ddfcb52
 
 
 
 
 
 
 
 
 
 
 
a9bc203
ddfcb52
a9bc203
ddfcb52
 
 
 
 
 
 
 
 
 
 
 
 
 
a9bc203
 
 
 
 
 
 
 
 
 
 
ddfcb52
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
license: cc-by-sa-4.0
language:
- ja
---
# cyberagent-open-calm-3b-gguf
[cyberagentさんが公開しているopen-calm-3b](https://huggingface.co/cyberagent/open-calm-3b)のggufフォーマット変換版です。

llama.cppのexamplesで動かせます。

## Usage (試用)

```
git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
```

Makefileを下記に修正します

1箇所目
```
gguf: examples/gguf/gguf.cpp                                  build-info.h ggml.o llama.o $(OBJS)
	$(CXX) $(CXXFLAGS) $(filter-out %.h,$^) -o $@ $(LDFLAGS)

```
の後に
```
gguf: examples/gguf/gguf.cpp                                  build-info.h ggml.o llama.o $(OBJS)
	$(CXX) $(CXXFLAGS) $(filter-out %.h,$^) -o $@ $(LDFLAGS)

gptneox: examples/gptneox-wip/gptneox-main.cpp	build-info.h ggml.o $(OBJS)
	$(CXX) $(CXXFLAGS) $(filter-out %.h,$^) -o $@ $(LDFLAGS)
```
この様に追加します。


2箇所目
```
BUILD_TARGETS = main quantize quantize-stats perplexity embedding vdot train-text-from-scratch convert-llama2c-to-ggml simple server embd-input-test gguf llama-bench 
``````
BUILD_TARGETS = main quantize quantize-stats perplexity embedding vdot train-text-from-scratch convert-llama2c-to-ggml simple server embd-input-test gguf llama-bench gptneox
```
この様にgptneoxを追加します。
後はmakeしてから実行します。

```
make 
./gptneox -m 'cyberagent-open-calm-3b-q4_0.gguf' -n 128 -t 8 -p '吾輩は猫である。名前は実を言うと、' 
```