Spaces:

raghunc0
/

raghunc0nano-gpt-shakespeare-demo

Runtime error

Upload folder using huggingface_hub

a2dad08 about 1 year ago

1.59 kB

	import gradio as gr

	from bigram_model import BigramLanguageModel
	import os
	from data_utils import *
	import torch

	def generate_nanogpt_text():
	model = BigramLanguageModel(vocab_size=65, n_embed=n_embed, block_size=BLOCK_SIZE, num_heads=n_head, n_layers=n_layer)
	ckpt = torch.load(os.path.join("./nano_gpt_ckpts", "ckpt_5k_iters.pt"))
	model.load_state_dict(ckpt['model'])

	char_tokenizer = load_int_char_tokenizer(load_text())

	context = torch.zeros((1, 1), dtype=torch.long)
	generated_text = char_tokenizer.decode(model.generate(context, max_new_tokens=400)[0].tolist())

	return generated_text


	#gr.Interface(fn=generate_nanogpt_text, inputs=gr.Button(value="Generate text!"), outputs='text').launch(share=True)


	with gr.Blocks() as demo:
	gr.Markdown(
	"""
	# Example of text generation with nano-gpt:


	The model checkpoint is the 'nano_gpt_ckpts' dir. The hyper params used are the exact same shown in the nano-gpt video by Karpathy, and the dataset size is just 1MB, so the text generated could be gibberish.

	Keep in mind the output is limited to 400 tokens so the inference runs within reasonable time (10s) on CPU. (Huggingface free tier)

	GPU inference can output much much longer sequences.
	Click on the "Generate text" button to see the generated text.
	""")
	generate_button = gr.Button("Generate text!")
	output = gr.Textbox(label="Generated text from nano-gpt")
	generate_button.click(fn=generate_nanogpt_text, inputs=None, outputs=output, api_name='nano-gpt text generation sample')

	demo.launch(share=True)