Transformers documentation

Blenderbot

Transformers

You are viewing v4.44.0 version. A newer version v4.57.0 is available.

Join the Hugging Face community

and get access to the augmented documentation experience

Collaborate on models, datasets and Spaces

Faster examples with accelerated inference

Switch between documentation themes

to get started

Blenderbot

免責事項: 何か奇妙なものを見つけた場合は、 Github Issue を報告してください。

Overview

Blender チャットボットモデルは、Recipes for building an open-domain chatbot Stephen Roller、Emily Dinan、Naman Goyal、Da Ju、Mary Williamson、yinghan Liu、で提案されました。ジン・シュー、マイル・オット、カート・シャスター、エリック・M・スミス、Y-ラン・ブーロー、ジェイソン・ウェストン、2020年4月30日。

論文の要旨は次のとおりです。

オープンドメインのチャットボットの構築は、機械学習研究にとって難しい分野です。これまでの研究では次のことが示されていますが、ニューラルモデルをパラメーターの数とトレーニング対象のデータのサイズでスケーリングすると、結果が向上します。高性能のチャットボットには他の要素も重要であることを示します。良い会話には多くのことが必要です会話の専門家がシームレスに融合するスキル: 魅力的な話のポイントを提供し、話を聞く一貫した態度を維持しながら、知識、共感、個性を適切に表現するペルソナ。適切なトレーニングデータと選択が与えられた場合、大規模モデルがこれらのスキルを学習できることを示します。世代戦略。 90M、2.7B、9.4B パラメーターモデルを使用してこれらのレシピのバリアントを構築し、モデルを作成します。コードは公開されています。人間による評価では、当社の最良のモデルが既存のアプローチよりも優れていることがマルチターンで示されています魅力と人間性の測定という観点からの対話。次に、分析によってこの作業の限界について説明します。弊社機種の故障事例

チップ：

Blenderbot は絶対位置埋め込みを備えたモデルであるため、通常は入力を右側にパディングすることをお勧めします。左。

このモデルは sshleifer によって提供されました。著者のコードはここにあります。

Implementation Notes

Blenderbot は、標準の seq2seq モデルトランスフォーマーベースのアーキテクチャを使用します。
利用可能なチェックポイントは、モデルハブで見つけることができます。
これは デフォルト Blenderbot モデルクラスです。ただし、次のような小さなチェックポイントもいくつかあります。 facebook/blenderbot_small_90M はアーキテクチャが異なるため、一緒に使用する必要があります。 BlenderbotSmall。

Usage

モデルの使用例を次に示します。

>>> from transformers import BlenderbotTokenizer, BlenderbotForConditionalGeneration

>>> mname = "facebook/blenderbot-400M-distill"
>>> model = BlenderbotForConditionalGeneration.from_pretrained(mname)
>>> tokenizer = BlenderbotTokenizer.from_pretrained(mname)
>>> UTTERANCE = "My friends are cool but they eat too many carbs."
>>> inputs = tokenizer([UTTERANCE], return_tensors="pt")
>>> reply_ids = model.generate(**inputs)
>>> print(tokenizer.batch_decode(reply_ids))
["<s> That's unfortunate. Are they trying to lose weight or are they just trying to be healthier?</s>"]

Transformers

Blenderbot

Overview

Implementation Notes

Usage

Documentation resources

BlenderbotConfig

class transformers.BlenderbotConfig

BlenderbotTokenizer

class transformers.BlenderbotTokenizer

build_inputs_with_special_tokens

BlenderbotTokenizerFast

class transformers.BlenderbotTokenizerFast

build_inputs_with_special_tokens

BlenderbotModel

class transformers.BlenderbotModel

forward

BlenderbotForConditionalGeneration

class transformers.BlenderbotForConditionalGeneration

forward

BlenderbotForCausalLM

class transformers.BlenderbotForCausalLM

forward

TFBlenderbotModel

class transformers.TFBlenderbotModel

call

TFBlenderbotForConditionalGeneration

class transformers.TFBlenderbotForConditionalGeneration

call

FlaxBlenderbotModel

class transformers.FlaxBlenderbotModel

__call__

encode

decode

FlaxBlenderbotForConditionalGeneration

class transformers.FlaxBlenderbotForConditionalGeneration

__call__

encode

decode

call

call