Spaces:

albertvillanova
/

wordle

Sleeping

App Files Files

xet

Community

wordle / app.py

albertvillanova HF Staff

Make state global

987f32b verified 28 days ago

raw

history blame contribute delete

3.67 kB

	from dataclasses import dataclass, field
	from typing import Any, Union

	import gradio as gr


	Observation = Union[str, dict[str, Any]]
	Action = Union[str, dict[str, Any]] # e.g., user message, tool call schema


	@dataclass
	class StepResult:
	observation: Observation
	reward: float
	done: bool
	info: dict[str, Any] = field(default_factory=dict)


	class WordleEnv:
	"""
	Demonstration env. Not a full game; 4-letter variant for brevity.

	Observations are emoji strings; actions are 4-letter lowercase words.
	Reward is 1.0 on success, else 0.0. Terminal on success or after 6 guesses.
	"""

	def __init__(self, *, secret: str = "word", max_guesses: int = 6) -> None:
	assert len(secret) == 4 and secret.isalpha()
	self._secret = secret
	self._max = max_guesses
	self._n = 0
	self._obs = "⬜" * 4

	def reset(self) -> Observation: # noqa: ARG002
	self._n = 0
	self._obs = "⬜" * 4
	return self._obs

	def step(self, action: Action) -> StepResult:
	guess: str = str(action)
	guess = guess.strip().lower()
	if len(guess) != 4 or not guess.isalpha():
	return StepResult(self._obs, -0.05, False, {"error": "invalid guess"})
	self._n += 1
	secret = self._secret
	feedback: list[str] = []
	for i, ch in enumerate(guess):
	if ch == secret[i]:
	feedback.append("🟩")
	elif ch in secret:
	feedback.append("🟨")
	else:
	feedback.append("⬜")
	self._obs = "".join(feedback)
	done = guess == secret or self._n >= self._max
	reward = 1.0 if guess == secret else 0.0
	return StepResult(self._obs, reward, done, {"guesses": self._n})

	def render(self) -> str:
	return self._obs


	# def step_fn(guess: str, wordle) -> tuple[str, float, bool, dict]:
	# """
	# Perform a step in the Wordle environment.
	#
	# Args:
	# guess (str): The guessed word (4-letter lowercase string).
	#
	# Returns:
	# tuple[str, float, bool, dict]: A tuple containing:
	# - observation: The observation after the step .
	# - reward: The reward obtained from the step.
	# - done: Whether the game is done.
	# - info: Additional info.
	# """
	# result = wordle.step(guess)
	# return result.observation, result.reward, result.done, result.info, wordle

	wordle = WordleEnv(secret="word")


	def step_fn(guess: str) -> tuple[str, float, bool, dict]:
	"""
	Perform a step in the Wordle environment.

	Args:
	guess (str): The guessed word (4-letter lowercase string).

	Returns:
	tuple[str, float, bool, dict]: A tuple containing:
	- observation: The observation after the step .
	- reward: The reward obtained from the step.
	- done: Whether the game is done.
	- info: Additional info.
	"""
	result = wordle.step(guess)
	return result.observation, result.reward, result.done, result.info


	# demo = gr.Interface(
	# fn=step_fn,
	# inputs=["text", gr.State(WordleEnv(secret="word"))],
	# outputs=[
	# gr.Textbox(label="Observation"),
	# gr.Number(label="Reward"),
	# gr.Textbox(label="Done"),
	# gr.Textbox(label="Info"),
	# gr.State(),
	# ],
	# )
	demo = gr.Interface(
	fn=step_fn,
	inputs=["text"],
	outputs=[
	gr.Textbox(label="Observation"),
	gr.Number(label="Reward"),
	gr.Textbox(label="Done"),
	gr.Textbox(label="Info"),
	],
	)


	if __name__ == "__main__":
	demo.launch(mcp_server=True)