LLM Course documentation
အခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
အခန်းပြီးဆုံးခြင်း စစ်ဆေးမှု
1. Language modeling pipeline ၏ အစီအစဉ်က ဘာလဲ။
2. Base Transformer model က ထုတ်ပေးတဲ့ tensor မှာ dimension ဘယ်နှစ်ခုရှိပြီး၊ ဘာတွေလဲ။
3. အောက်ပါတို့ထဲမှ မည်သည့်အရာက subword tokenization ဥပမာတစ်ခုလဲ။
4. Model head ဆိုတာ ဘာလဲ။
5. AutoModel ဆိုတာ ဘာလဲ။
6. အရှည်မတူညီသော sequences များကို အတူတကွ batch လုပ်သည့်အခါ မည်သည့်နည်းလမ်းများကို သိရှိထားသင့်သလဲ။
7. sequence classification model က ထုတ်ပေးတဲ့ logits တွေပေါ်မှာ SoftMax function ကို အသုံးပြုရခြင်းရဲ့ ရည်ရွယ်ချက်က ဘာလဲ။
8. tokenizer API ရဲ့ အများစုက ဘယ် method ပေါ်မှာ အခြေခံထားလဲ။
9. ဒီ code sample မှာ result variable က ဘာတွေ ပါဝင်သလဲ။
from transformers import AutoTokenizer
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
result = tokenizer.tokenize("Hello!")10. အောက်ပါ code မှာ တစ်ခုခု မှားနေတာ ရှိပါသလား။
from transformers import AutoTokenizer, AutoModel
tokenizer = AutoTokenizer.from_pretrained("bert-base-cased")
model = AutoModel.from_pretrained("gpt2")
encoded = tokenizer("Hey!", return_tensors="pt")
result = model(**encoded)