File size: 1,520 Bytes
5ccd907
 
 
 
 
 
 
 
 
 
 
 
5a959c0
5ccd907
 
 
 
 
5a959c0
 
5ccd907
 
 
 
 
 
5a959c0
5ccd907
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
---
license: apache-2.0
datasets:
- llm-book/aio-retriever
language:
- ja
library_name: transformers
pipeline_tag: feature-extraction
---

# bert-base-japanese-v3-bpr-passage-aio

「[大規模言語モデル入門](https://www.amazon.co.jp/dp/4297136333)」の第9章で紹介している文書検索モデルBPRのパッセージエンコーダです。
[cl-tohoku/bert-base-japanese-v3](https://huggingface.co/cl-tohoku/bert-base-japanese-v3) を [llm-book/aio-retriever](https://huggingface.co/datasets/llm-book/aio-retriever) でファインチューニングして構築されています。

## 関連リンク

* [GitHubリポジトリ](https://github.com/ghmagazine/llm-book)
* [Colabノートブック(訓練)](https://colab.research.google.com/github/ghmagazine/llm-book/blob/main/chapter9/9-4-3-bpr-training.ipynb)
* [Colabノートブック(推論)](https://colab.research.google.com/github/ghmagazine/llm-book/blob/main/chapter9/9-4-4-bpr-embedding.ipynb)
* [データセット](https://huggingface.co/datasets/llm-book/aio-retriever)
* [大規模言語モデル入門(Amazon.co.jp)](https://www.amazon.co.jp/dp/4297136333/)
* [大規模言語モデル入門(gihyo.jp)](https://gihyo.jp/book/2023/978-4-297-13633-8)

## 使い方

BPRのパッセージエンコーダの使い方については、書籍の第9章、および上記関連リンクのColabノートブックを参照してください。

## ライセンス

[Apache License 2.0](https://www.apache.org/licenses/LICENSE-2.0)