Spaces:

raghunc0
/

raghunc0nano-gpt-shakespeare-demo

Runtime error

File size: 1,612 Bytes

import gradio as gr

from bigram_model import BigramLanguageModel
import os
from data_utils import *
import torch

def generate_nanogpt_text():
    model = BigramLanguageModel(vocab_size=65, n_embed=n_embed, block_size=BLOCK_SIZE, num_heads=n_head, n_layers=n_layer)
    ckpt = torch.load(os.path.join("./nano_gpt_ckpts", "ckpt_5k_iters.pt"), map_location=torch.device('cpu'))
    model.load_state_dict(ckpt['model'])

    char_tokenizer = load_int_char_tokenizer(load_text())

    context = torch.zeros((1, 1), dtype=torch.long)
    generated_text = char_tokenizer.decode(model.generate(context, max_new_tokens=400)[0].tolist())

    return generated_text


#gr.Interface(fn=generate_nanogpt_text, inputs=gr.Button(value="Generate text!"), outputs='text').launch(share=True)


with  gr.Blocks() as demo:
    gr.Markdown(
    """
    # Example of text generation with nano-gpt:


   The model checkpoint is the 'nano_gpt_ckpts' dir. The hyper params used are the exact same shown in the nano-gpt video by Karpathy, and the dataset size is just 1MB, so the text generated could be gibberish.

   Keep in mind the output is limited to 400 tokens so the inference runs within reasonable time (10s) on CPU. (Huggingface free tier)

   GPU inference can output much much longer sequences.
   Click on the "Generate text" button to see the generated text. 
    """)
    generate_button = gr.Button("Generate text!")
    output = gr.Textbox(label="Generated text from nano-gpt")
    generate_button.click(fn=generate_nanogpt_text, inputs=None, outputs=output, api_name='nano-gpt text generation sample')

demo.launch()