Bedrock Titan Text Embeddings v2

This repository contains the MTEB scores and usage examples of Bedrock Titan Text Embeddings v2. You can use the embedding model either via the Bedrock InvokeModel API or via Bedrock's batch jobs. For RAG use cases we recommend the former to embed queries during search (latency optimized) and the latter to index corpus (throughput optimized).

Using Bedrock's InvokeModel API

import json
import boto3
class TitanEmbeddings(object):
    accept = "application/json"
    content_type = "application/json"
    
    def __init__(self, model_id="amazon.titan-embed-text-v2:0"):
        self.bedrock = boto3.client(service_name='bedrock-runtime')
        self.model_id = model_id
    def __call__(self, text, dimensions, normalize=True):
        """
        Returns Titan Embeddings
        Args:
            text (str): text to embed
            dimensions (int): Number of output dimensions.
            normalize (bool): Whether to return the normalized embedding or not.
        Return:
            List[float]: Embedding
            
        """
        body = json.dumps({
            "inputText": text,
            "dimensions": dimensions,
            "normalize": normalize
        })
        response = self.bedrock.invoke_model(
            body=body, modelId=self.model_id, accept=self.accept, contentType=self.content_type
        )
        response_body = json.loads(response.get('body').read())
        return response_body['embedding']

if __name__ == '__main__':
    """
    Entrypoint for Amazon Titan Embeddings V2 - Text example.
    """
    dimensions = 1024
    normalize = True
    
    titan_embeddings_v2 = TitanEmbeddings(model_id="amazon.titan-embed-text-v2:0")

    input_text = "What are the different services that you offer?"
    embedding = titan_embeddings_v2(input_text, dimensions, normalize)
    
    print(f"{input_text=}")
    print(f"{embedding[:10]=}")

Using Bedrock's batch jobs

import requests
from aws_requests_auth.boto_utils import BotoAWSRequestsAuth

region = "us-east-1"
base_uri = f"bedrock.{region}.amazonaws.com"
batch_job_uri = f"https://{base_uri}/model-invocation-job/"

# For details on how to set up an IAM role for batch inference, see
# https://docs.aws.amazon.com/bedrock/latest/userguide/batch-inference-permissions.html
role_arn = "arn:aws:iam::111122223333:role/my-batch-inference-role"

payload = {
   "inputDataConfig": { 
        "s3InputDataConfig": { 
            "s3Uri": "s3://my-input-bucket/batch-input/",
            "s3InputFormat": "JSONL"
        }
   },
   "jobName": "embeddings-v2-batch-job",
   "modelId": "amazon.titan-embed-text-v2:0",
   "outputDataConfig": {
        "s3OutputDataConfig": {
            "s3Uri": "s3://my-output-bucket/batch-output/"
        }
   },
   "roleArn": role_arn
}

request_auth = BotoAWSRequestsAuth(
    aws_host=base_uri,
    aws_region=region,
    aws_service="bedrock"
)


response= requests.request("POST", batch_job_uri, json=payload, auth=request_auth)
print(response.json())

Downloads last month: 3,132

Evaluation results

accuracy on MTEB AmazonCounterfactualClassification (en)
test set self-reported

79.313
ap on MTEB AmazonCounterfactualClassification (en)
test set self-reported

43.947
f1 on MTEB AmazonCounterfactualClassification (en)
test set self-reported

73.613
accuracy on MTEB AmazonCounterfactualClassification (de)
test set self-reported

70.942
ap on MTEB AmazonCounterfactualClassification (de)
test set self-reported

82.301
f1 on MTEB AmazonCounterfactualClassification (de)
test set self-reported

69.380
accuracy on MTEB AmazonCounterfactualClassification (en-ext)
test set self-reported

82.294
ap on MTEB AmazonCounterfactualClassification (en-ext)
test set self-reported

29.957
f1 on MTEB AmazonCounterfactualClassification (en-ext)
test set self-reported

68.882
accuracy on MTEB AmazonCounterfactualClassification (ja)
test set self-reported

80.064
ap on MTEB AmazonCounterfactualClassification (ja)
test set self-reported

25.244
f1 on MTEB AmazonCounterfactualClassification (ja)
test set self-reported

65.538
accuracy on MTEB AmazonPolarityClassification
test set self-reported

76.664
ap on MTEB AmazonPolarityClassification
test set self-reported

70.770
f1 on MTEB AmazonPolarityClassification
test set self-reported

76.541
accuracy on MTEB AmazonReviewsClassification (en)
test set self-reported

35.276
f1 on MTEB AmazonReviewsClassification (en)
test set self-reported

34.906
accuracy on MTEB AmazonReviewsClassification (de)
test set self-reported

38.826
f1 on MTEB AmazonReviewsClassification (de)
test set self-reported

37.713
accuracy on MTEB AmazonReviewsClassification (es)
test set self-reported

39.386
f1 on MTEB AmazonReviewsClassification (es)
test set self-reported

38.243
accuracy on MTEB AmazonReviewsClassification (fr)
test set self-reported

39.472
f1 on MTEB AmazonReviewsClassification (fr)
test set self-reported

38.372
accuracy on MTEB AmazonReviewsClassification (ja)
test set self-reported

35.898
f1 on MTEB AmazonReviewsClassification (ja)
test set self-reported

35.187

View on Papers With Code