Transformers documentation

모델 출력

Transformers

You are viewing main version, which requires installation from source. If you'd like regular pip install, checkout the latest stable version (v4.47.1).

Join the Hugging Face community

and get access to the augmented documentation experience

Collaborate on models, datasets and Spaces

Faster examples with accelerated inference

Switch between documentation themes

to get started

모델 출력

모든 모델에는 ModelOutput의 서브클래스의 인스턴스인 모델 출력이 있습니다. 이들은 모델에서 반환되는 모든 정보를 포함하는 데이터 구조이지만 튜플이나 딕셔너리로도 사용할 수 있습니다.

예제를 통해 살펴보겠습니다:

from transformers import BertTokenizer, BertForSequenceClassification
import torch

tokenizer = BertTokenizer.from_pretrained("google-bert/bert-base-uncased")
model = BertForSequenceClassification.from_pretrained("google-bert/bert-base-uncased")

inputs = tokenizer("Hello, my dog is cute", return_tensors="pt")
labels = torch.tensor([1]).unsqueeze(0)  # 배치 크기 1
outputs = model(**inputs, labels=labels)

outputs 객체는 SequenceClassifierOutput입니다. 아래 해당 클래스의 문서에서 볼 수 있듯이, loss(선택적), logits, hidden_states(선택적) 및 attentions(선택적) 항목이 있습니다. 여기에서는 labels를 전달했기 때문에 loss가 있지만 hidden_states와 attentions가 없는데, 이는 output_hidden_states=True 또는 output_attentions=True를 전달하지 않았기 때문입니다.

output_hidden_states=True를 전달할 때 outputs.hidden_states[-1]가 outputs.last_hidden_state와 정확히 일치할 것으로 예상할 수 있습니다. 하지만 항상 그런 것은 아닙니다. 일부 모델은 마지막 은닉 상태가 반환될 때 정규화를 적용하거나 다른 후속 프로세스를 적용합니다.

일반적으로 사용할 때와 동일하게 각 속성들에 접근할 수 있으며, 모델이 해당 속성을 반환하지 않은 경우 None이 반환됩니다. 예시에서는 outputs.loss는 모델에서 계산한 손실이고 outputs.attentions는 None입니다.

outputs 객체를 튜플로 간주할 때는 None 값이 없는 속성만 고려합니다. 예시에서는 loss와 logits라는 두 개의 요소가 있습니다. 그러므로,

outputs[:2]

는 (outputs.loss, outputs.logits) 튜플을 반환합니다.

outputs 객체를 딕셔너리로 간주할 때는 None 값이 없는 속성만 고려합니다. 예시에는 loss와 logits라는 두 개의 키가 있습니다.

여기서부터는 두 가지 이상의 모델 유형에서 사용되는 일반 모델 출력을 다룹니다. 구체적인 출력 유형은 해당 모델 페이지에 문서화되어 있습니다.

Transformers

모델 출력

ModelOutput

class transformers.utils.ModelOutput

to_tuple

BaseModelOutput

class transformers.modeling_outputs.BaseModelOutput

BaseModelOutputWithPooling

class transformers.modeling_outputs.BaseModelOutputWithPooling

BaseModelOutputWithCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithCrossAttentions

BaseModelOutputWithPoolingAndCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithPoolingAndCrossAttentions

BaseModelOutputWithPast

class transformers.modeling_outputs.BaseModelOutputWithPast

BaseModelOutputWithPastAndCrossAttentions

class transformers.modeling_outputs.BaseModelOutputWithPastAndCrossAttentions

Seq2SeqModelOutput

class transformers.modeling_outputs.Seq2SeqModelOutput

CausalLMOutput

class transformers.modeling_outputs.CausalLMOutput

CausalLMOutputWithCrossAttentions

class transformers.modeling_outputs.CausalLMOutputWithCrossAttentions

CausalLMOutputWithPast

class transformers.modeling_outputs.CausalLMOutputWithPast

MaskedLMOutput

class transformers.modeling_outputs.MaskedLMOutput

Seq2SeqLMOutput

class transformers.modeling_outputs.Seq2SeqLMOutput

NextSentencePredictorOutput

class transformers.modeling_outputs.NextSentencePredictorOutput

SequenceClassifierOutput

class transformers.modeling_outputs.SequenceClassifierOutput

Seq2SeqSequenceClassifierOutput

class transformers.modeling_outputs.Seq2SeqSequenceClassifierOutput

MultipleChoiceModelOutput

class transformers.modeling_outputs.MultipleChoiceModelOutput

TokenClassifierOutput

class transformers.modeling_outputs.TokenClassifierOutput

QuestionAnsweringModelOutput

class transformers.modeling_outputs.QuestionAnsweringModelOutput

Seq2SeqQuestionAnsweringModelOutput

class transformers.modeling_outputs.Seq2SeqQuestionAnsweringModelOutput

Seq2SeqSpectrogramOutput

class transformers.modeling_outputs.Seq2SeqSpectrogramOutput

SemanticSegmenterOutput

class transformers.modeling_outputs.SemanticSegmenterOutput

ImageClassifierOutput

class transformers.modeling_outputs.ImageClassifierOutput

ImageClassifierOutputWithNoAttention

class transformers.modeling_outputs.ImageClassifierOutputWithNoAttention

DepthEstimatorOutput

class transformers.modeling_outputs.DepthEstimatorOutput

Wav2Vec2BaseModelOutput

class transformers.modeling_outputs.Wav2Vec2BaseModelOutput

XVectorOutput

class transformers.modeling_outputs.XVectorOutput

Seq2SeqTSModelOutput

class transformers.modeling_outputs.Seq2SeqTSModelOutput

Seq2SeqTSPredictionOutput

class transformers.modeling_outputs.Seq2SeqTSPredictionOutput

SampleTSPredictionOutput

class transformers.modeling_outputs.SampleTSPredictionOutput

TFBaseModelOutput

class transformers.modeling_tf_outputs.TFBaseModelOutput

TFBaseModelOutputWithPooling

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPooling

TFBaseModelOutputWithPoolingAndCrossAttentions

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPoolingAndCrossAttentions

TFBaseModelOutputWithPast

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPast

TFBaseModelOutputWithPastAndCrossAttentions

class transformers.modeling_tf_outputs.TFBaseModelOutputWithPastAndCrossAttentions

TFSeq2SeqModelOutput

class transformers.modeling_tf_outputs.TFSeq2SeqModelOutput

TFCausalLMOutput

class transformers.modeling_tf_outputs.TFCausalLMOutput

TFCausalLMOutputWithCrossAttentions

class transformers.modeling_tf_outputs.TFCausalLMOutputWithCrossAttentions

TFCausalLMOutputWithPast