louisbrulenaudet/legalkit
Viewer • Updated • 53k • 208 • 33
How to use IvanDVonga/LegalEmbed with sentence-transformers:
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("IvanDVonga/LegalEmbed")
sentences = [
"C'est une personne heureuse",
"C'est un chien heureux",
"C'est une personne très heureuse",
"Aujourd'hui est une journée ensoleillée"
]
embeddings = model.encode(sentences)
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [4, 4]Modèle d'embeddings fine-tuné sur le droit français, à partir de
paraphrase-multilingual-mpnet-base-v2
et du dataset louisbrulenaudet/legalkit
(~53k articles de codes juridiques français).
from sentence_transformers import SentenceTransformer
model = SentenceTransformer("IvanDVonga/LegalEmbed")
query = "Question juridique : Quelles sont les conditions de validité d'un contrat ?"
doc = "Texte de loi : Pour qu'un contrat soit valable, il faut le consentement des parties."
embeddings = model.encode([query, doc], normalize_embeddings=True)
similarity = embeddings[0] @ embeddings[1]
print(f"Similarité : {similarity:.4f}")
| Type de texte | Préfixe |
|---|---|
| Question / requête | "Question juridique : " |
| Article de loi / document | "Texte de loi : " |
MultipleNegativesRankingLoss (in-batch negatives)