Spaces:

trioskosmos
/

rabukasim

Sleeping

App Files Files Community

rabukasim / engine_rust_src /src /py_bindings.rs

trioskosmos

Upload folder using huggingface_hub

463f868 verified 12 days ago

raw

history blame contribute delete

63.1 kB

	use crate::core::alphazero_encoding::AlphaZeroEncoding;
	use crate::core::alphazero_evaluator::AlphaZeroEvaluator;
	use crate::core::heuristics::{EvalMode, HeuristicConfig, LegacyHeuristic, OriginalHeuristic};
	use crate::core::logic::constants::STAGE_SLOT_COUNT;
	use crate::core::logic::{ChoiceType, GameState, Phase, PlayerState, StandardizedState};
	use crate::core::mcts::{SearchHorizon, MCTS};
	use numpy::{PyArray1, PyArray2, PyArrayMethods, PyReadonlyArray1};
	use pyo3::prelude::*;
	use rayon::prelude::*;
	use rand::prelude::*;
	use rand::rngs::SmallRng;
	use smallvec::SmallVec;
	use std::sync::Arc;
	use serde_json::json;
	// use crate::core::heuristics::{OriginalHeuristic, SimpleHeuristic};

	#[pyclass]
	#[derive(Clone)]
	pub struct PyPlayerState {
	pub inner: PlayerState,
	}

	#[pymethods]
	impl PyPlayerState {
	#[getter]
	fn player_id(&self) -> u8 {
	self.inner.player_id
	}

	#[getter]
	fn score(&self) -> u32 {
	self.inner.score
	}
	#[setter(score)]
	fn set_score_prop(&mut self, val: u32) {
	self.set_score(val);
	}
	fn set_score(&mut self, val: u32) {
	self.inner.score = val;
	}

	#[getter]
	fn success_lives(&self) -> Vec<u32> {
	self.inner.success_lives.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(success_lives)]
	fn set_success_lives_prop(&mut self, val: Vec<u32>) {
	self.set_success_lives(val);
	}
	fn set_success_lives(&mut self, val: Vec<u32>) {
	self.inner.success_lives = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn hand(&self) -> Vec<u32> {
	self.inner.hand.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(hand)]
	fn set_hand_prop(&mut self, val: Vec<u32>) {
	self.set_hand(val);
	}
	fn set_hand(&mut self, val: Vec<u32>) {
	self.inner.hand = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn stage(&self) -> [i32; 3] {
	[
	self.inner.stage[0] as i32,
	self.inner.stage[1] as i32,
	self.inner.stage[2] as i32,
	]
	}
	#[setter(stage)]
	fn set_stage_prop(&mut self, val: [i32; 3]) {
	self.set_stage(val);
	}
	fn set_stage(&mut self, val: [i32; 3]) {
	self.inner.stage = [val[0], val[1], val[2]];
	}

	#[getter]
	fn discard(&self) -> Vec<u32> {
	self.inner.discard.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(discard)]
	fn set_discard_prop(&mut self, val: Vec<u32>) {
	self.set_discard(val);
	}
	fn set_discard(&mut self, val: Vec<u32>) {
	self.inner.discard = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn exile(&self) -> Vec<u32> {
	self.inner.exile.iter().map(\|&x\| x as u32).collect()
	}

	#[getter]
	fn deck(&self) -> Vec<u32> {
	self.inner.deck.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(deck)]
	fn set_deck_prop(&mut self, val: Vec<u32>) {
	self.set_deck(val);
	}
	fn set_deck(&mut self, val: Vec<u32>) {
	self.inner.deck = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn initial_deck(&self) -> Vec<u32> {
	self.inner.initial_deck.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(initial_deck)]
	fn set_initial_deck_prop(&mut self, val: Vec<u32>) {
	self.set_initial_deck(val);
	}
	fn set_initial_deck(&mut self, val: Vec<u32>) {
	self.inner.initial_deck = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn energy_zone(&self) -> Vec<u32> {
	self.inner.energy_zone.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(energy_zone)]
	fn set_energy_zone_prop(&mut self, val: Vec<u32>) {
	self.set_energy_zone(val);
	}
	fn set_energy_zone(&mut self, val: Vec<u32>) {
	self.inner.energy_zone = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn energy_deck(&self) -> Vec<u32> {
	self.inner.energy_deck.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(energy_deck)]
	fn set_energy_deck_prop(&mut self, val: Vec<u32>) {
	self.set_energy_deck(val);
	}
	fn set_energy_deck(&mut self, val: Vec<u32>) {
	self.inner.energy_deck = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn live_zone(&self) -> [i32; 3] {
	[
	self.inner.live_zone[0] as i32,
	self.inner.live_zone[1] as i32,
	self.inner.live_zone[2] as i32,
	]
	}
	#[setter(live_zone)]
	fn set_live_zone_prop(&mut self, val: [i32; 3]) {
	self.set_live_zone(val);
	}
	fn set_live_zone(&mut self, val: [i32; 3]) {
	self.inner.live_zone = [val[0], val[1], val[2]];
	}

	#[getter]
	fn live_zone_revealed(&self) -> [bool; 3] {
	[
	self.inner.is_revealed(0),
	self.inner.is_revealed(1),
	self.inner.is_revealed(2),
	]
	}
	#[setter(live_zone_revealed)]
	fn set_live_zone_revealed_prop(&mut self, val: [bool; 3]) {
	self.set_live_zone_revealed(val);
	}
	fn set_live_zone_revealed(&mut self, val: [bool; 3]) {
	for (i, &v) in val.iter().enumerate() {
	self.inner.set_revealed(i, v);
	}
	}

	#[getter]
	fn tapped_energy(&self) -> Vec<bool> {
	(0..self.inner.energy_zone.len())
	.map(\|i\| self.inner.is_energy_tapped(i))
	.collect()
	}
	#[setter(tapped_energy)]
	fn set_tapped_energy_prop(&mut self, val: Vec<bool>) {
	self.set_tapped_energy(val);
	}
	fn set_tapped_energy(&mut self, val: Vec<bool>) {
	self.inner.tapped_energy_mask = 0;
	for (i, &tapped) in val.iter().enumerate() {
	if tapped {
	self.inner.set_energy_tapped(i, true);
	}
	}
	}

	#[getter]
	fn tapped_members(&self) -> [bool; 3] {
	[
	self.inner.is_tapped(0),
	self.inner.is_tapped(1),
	self.inner.is_tapped(2),
	]
	}
	#[setter(tapped_members)]
	fn set_tapped_members_prop(&mut self, val: [bool; 3]) {
	self.set_tapped_members(val);
	}
	fn set_tapped_members(&mut self, val: [bool; 3]) {
	for i in 0..3 {
	self.inner.set_tapped(i, val[i]);
	}
	}

	#[setter(moved_members_this_turn)]
	fn set_moved_members_this_turn_prop(&mut self, val: [bool; 3]) {
	self.set_moved_members_this_turn(val);
	}
	fn set_moved_members_this_turn(&mut self, val: [bool; 3]) {
	for i in 0..3 {
	self.inner.set_moved(i, val[i]);
	}
	}

	#[getter]
	fn base_revealed_cards(&self) -> Vec<u32> {
	self.inner.looked_cards.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(base_revealed_cards)]
	fn set_base_revealed_cards_prop(&mut self, val: Vec<u32>) {
	self.set_base_revealed_cards(val);
	}
	fn set_base_revealed_cards(&mut self, val: Vec<u32>) {
	self.inner.looked_cards = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn revealed_cards(&self) -> Vec<u32> {
	self.inner.looked_cards.iter().map(\|&x\| x as u32).collect()
	}
	#[setter(revealed_cards)]
	fn set_revealed_cards_prop(&mut self, val: Vec<u32>) {
	self.set_revealed_cards(val);
	}
	fn set_revealed_cards(&mut self, val: Vec<u32>) {
	self.inner.looked_cards = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn looked_cards(&self) -> Vec<u32> {
	self.inner.looked_cards.iter().map(\|&x\| x as u32).collect()
	}
	fn set_looked_cards(&mut self, val: Vec<u32>) {
	self.inner.looked_cards = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn deck_count(&self) -> usize {
	self.inner.deck.len()
	}
	#[getter]
	fn energy_deck_count(&self) -> usize {
	self.inner.energy_deck.len()
	}

	#[getter]
	fn mulligan_selection(&self) -> u64 {
	self.inner.mulligan_selection
	}
	#[setter(mulligan_selection)]
	fn set_mulligan_selection_prop(&mut self, val: u64) {
	self.set_mulligan_selection(val);
	}
	fn set_mulligan_selection(&mut self, val: u64) {
	self.inner.mulligan_selection = val;
	}

	#[getter]
	fn baton_touch_count(&self) -> u32 {
	self.inner.baton_touch_count as u32
	}
	#[setter(baton_touch_count)]
	fn set_baton_touch_count_prop(&mut self, val: u32) {
	self.set_baton_touch_count(val);
	}
	fn set_baton_touch_count(&mut self, val: u32) {
	self.inner.baton_touch_count = val as u8;
	}

	#[getter]
	fn baton_touch_limit(&self) -> u32 {
	self.inner.baton_touch_limit as u32
	}
	#[setter(baton_touch_limit)]
	fn set_baton_touch_limit_prop(&mut self, val: u32) {
	self.set_baton_touch_limit(val);
	}
	fn set_baton_touch_limit(&mut self, val: u32) {
	self.inner.baton_touch_limit = val as u8;
	}

	#[getter]
	fn hand_added_turn(&self) -> Vec<u32> {
	self.inner
	.hand_added_turn
	.iter()
	.map(\|&x\| x as u32)
	.collect()
	}
	#[setter(hand_added_turn)]
	fn set_hand_added_turn_prop(&mut self, val: Vec<u32>) {
	self.set_hand_added_turn(val);
	}
	fn set_hand_added_turn(&mut self, val: Vec<u32>) {
	self.inner.hand_added_turn = val.into_iter().map(\|x\| x as i32).collect();
	}

	#[getter]
	fn yell_cards(&self) -> Vec<u32> {
	Vec::new()
	}
	#[setter(yell_cards)]
	fn set_yell_cards_prop(&mut self, _val: Vec<u32>) {}
	fn set_yell_cards(&mut self, _val: Vec<u32>) {}

	#[getter]
	pub fn heart_buffs(&self) -> Vec<Vec<i32>> {
	self.inner
	.heart_buffs
	.iter()
	.map(\|h\| h.to_array().iter().map(\|&x\| x as i32).collect())
	.collect()
	}
	#[setter(heart_buffs)]
	pub fn set_heart_buffs_prop(&mut self, val: Vec<Vec<i32>>) {
	self.set_heart_buffs(val);
	}
	pub fn set_heart_buffs(&mut self, val: Vec<Vec<i32>>) {
	for (i, v) in val.iter().enumerate() {
	if i < 3 && v.len() == 7 {
	for (j, &heart) in v.iter().enumerate() {
	self.inner.heart_buffs[i].set_color_count(j, heart.max(0).min(255) as u8);
	}
	}
	}
	}

	#[getter]
	pub fn blade_buffs(&self) -> Vec<i32> {
	self.inner.blade_buffs.iter().map(\|&x\| x as i32).collect()
	}
	#[setter(blade_buffs)]
	pub fn set_blade_buffs_prop(&mut self, val: Vec<i32>) {
	self.set_blade_buffs(val);
	}
	pub fn set_blade_buffs(&mut self, val: Vec<i32>) {
	for (i, &v) in val.iter().enumerate() {
	if i < 3 {
	self.inner.blade_buffs[i] = v as i16;
	}
	}
	}

	#[getter]
	pub fn activated_energy_group_mask(&self) -> u32 {
	self.inner.activated_energy_group_mask
	}
	#[setter(activated_energy_group_mask)]
	pub fn set_activated_energy_group_mask(&mut self, val: u32) {
	self.inner.activated_energy_group_mask = val;
	}

	#[getter]
	pub fn activated_member_group_mask(&self) -> u32 {
	self.inner.activated_member_group_mask
	}
	#[setter(activated_member_group_mask)]
	pub fn set_activated_member_group_mask(&mut self, val: u32) {
	self.inner.activated_member_group_mask = val;
	}

	#[getter]
	pub fn flags(&self) -> u32 {
	self.inner.flags
	}
	#[setter(flags)]
	pub fn set_flags(&mut self, val: u32) {
	self.inner.flags = val;
	}
	}

	#[pyclass]
	#[derive(Clone)]
	pub struct PyPendingInteraction {
	#[pyo3(get)]
	pub choice_type: String,
	#[pyo3(get)]
	pub filter_attr: u64,
	#[pyo3(get)]
	pub ctx: String, // Stringified AbilityContext
	}

	#[pyclass]
	#[derive(Clone)]
	pub struct PyCardDatabase {
	pub inner: std::sync::Arc<crate::core::logic::CardDatabase>,
	}

	#[pymethods]
	impl PyCardDatabase {
	#[new]
	fn new(json_str: &str) -> PyResult<Self> {
	let db = crate::core::logic::CardDatabase::from_json(json_str).map_err(
	\|e: serde_json::Error\| pyo3::exceptions::PyValueError::new_err(e.to_string()),
	)?;
	Ok(Self {
	inner: std::sync::Arc::new(db),
	})
	}

	#[getter]
	fn member_count(&self) -> usize {
	self.inner.members.len()
	}

	#[getter]
	fn live_count(&self) -> usize {
	self.inner.lives.len()
	}

	fn has_member(&self, card_id: u32) -> bool {
	self.inner.members.contains_key(&(card_id as i32))
	}

	fn get_member_ids(&self) -> Vec<u32> {
	self.inner.members.keys().map(\|&k\| k as u32).collect()
	}

	fn get_live_ids(&self) -> Vec<u32> {
	self.inner.lives.keys().map(\|&k\| k as u32).collect()
	}

	fn get_energy_ids(&self) -> Vec<u32> {
	self.inner.energy_db.keys().map(\|&k\| k as u32).collect()
	}

	#[getter]
	fn is_vanilla(&self) -> bool {
	self.inner.is_vanilla
	}

	#[setter]
	fn set_is_vanilla(&mut self, val: bool) {
	if let Some(db) = std::sync::Arc::get_mut(&mut self.inner) {
	db.is_vanilla = val;
	} else {
	let mut new_inner = (*self.inner).clone();
	new_inner.is_vanilla = val;
	self.inner = std::sync::Arc::new(new_inner);
	}
	}
	}

	#[pyclass]
	pub struct PyGameState {
	pub inner: GameState,
	pub db: PyCardDatabase,
	pub legal_action_buffer: Vec<bool>,
	}

	#[pymethods]
	impl PyGameState {
	#[new]
	fn new(db: PyCardDatabase) -> PyResult<Self> {
	Ok(Self {
	inner: GameState::default(),
	db,
	legal_action_buffer: vec![false; crate::core::logic::ACTION_SPACE],
	})
	}

	pub fn copy(&self) -> Self {
	Self {
	inner: self.inner.clone(),
	db: self.db.clone(),
	legal_action_buffer: vec![false; crate::core::logic::ACTION_SPACE],
	}
	}

	pub fn ping(&self) -> String {
	"pong_v_force_fix_1215".to_string()
	}

	#[getter]
	fn db(&self) -> PyCardDatabase {
	self.db.clone()
	}

	#[getter]
	fn current_player(&self) -> u8 {
	self.inner.current_player
	}

	#[setter]
	fn set_current_player(&mut self, val: u8) {
	self.inner.current_player = val;
	}

	#[getter]
	fn first_player(&self) -> u8 {
	self.inner.first_player
	}

	#[setter]
	fn set_first_player(&mut self, val: u8) {
	self.inner.first_player = val;
	}

	#[getter]
	fn rps_choices(&self) -> [i8; 2] {
	self.inner.rps_choices
	}

	#[getter]
	fn rule_log(&self) -> Vec<String> {
	self.inner.ui.rule_log.clone().unwrap_or_default()
	}

	#[getter]
	fn trace_log(&self) -> Vec<String> {
	self.inner.debug.trace_log.clone()
	}

	#[getter]
	fn bytecode_log(&self) -> Vec<String> {
	self.inner.ui.bytecode_log.clone()
	}

	fn clear_bytecode_log(&mut self) {
	self.inner.ui.bytecode_log.clear();
	}

	#[getter]
	fn silent(&self) -> bool {
	self.inner.ui.silent
	}

	#[setter]
	fn set_silent(&mut self, val: bool) {
	self.inner.ui.silent = val;
	}

	#[getter]
	fn turn_history(&self) -> Vec<String> {
	if let Some(ref history) = self.inner.core.turn_history {
	history.iter().map(\|e\| format!("{:?}", e)).collect()
	} else {
	Vec::new()
	}
	}

	fn generate_execution_id(&mut self) -> u32 {
	self.inner.generate_execution_id()
	}

	fn clear_execution_id(&mut self) {
	self.inner.clear_execution_id();
	}

	fn get_current_execution_id(&self) -> Option<u32> {
	self.inner.ui.current_execution_id
	}

	fn log(&mut self, msg: String) {
	self.inner.log(msg);
	}

	#[getter]
	fn phase(&self) -> i8 {
	self.inner.phase as i8
	}

	#[getter]
	fn phase_name(&self) -> String {
	format!("{:?}", self.inner.phase)
	}

	#[getter]
	fn acting_player(&self) -> u8 {
	match self.inner.phase {
	Phase::Response => {
	if let Some(pi) = self.inner.interaction_stack.last() {
	pi.ctx.player_id as u8
	} else {
	self.inner.current_player
	}
	}
	_ => self.inner.current_player,
	}
	}

	#[getter]
	fn turn(&self) -> u32 {
	self.inner.turn as u32
	}

	#[setter]
	fn set_turn(&mut self, val: u32) {
	self.inner.turn = val as u16;
	}

	#[getter]
	fn debug_mode(&self) -> bool {
	self.inner.debug.debug_mode
	}

	#[setter(debug_mode)]
	fn set_debug_mode(&mut self, val: bool) {
	self.inner.debug.debug_mode = val;
	}

	#[getter]
	fn debug_ignore_conditions(&self) -> bool {
	self.inner.debug.debug_ignore_conditions
	}

	#[setter(debug_ignore_conditions)]
	fn set_debug_ignore_conditions(&mut self, val: bool) {
	self.inner.debug.debug_ignore_conditions = val;
	}

	fn apply_state_json(&mut self, json_str: &str) -> PyResult<()> {
	let new_state: GameState = serde_json::from_str(json_str).map_err(\|e\| {
	pyo3::exceptions::PyValueError::new_err(format!("Invalid state JSON: {}", e))
	})?;
	self.inner = new_state;
	Ok(())
	}

	pub fn to_json(&self) -> PyResult<String> {
	serde_json::to_string(&self.inner).map_err(\|e\| {
	pyo3::exceptions::PyValueError::new_err(format!("Serialization error: {}", e))
	})
	}

	#[pyo3(signature = (room_id, mode, include_tensor=true, history=None))]
	fn to_standardized_json(
	&self,
	room_id: String,
	mode: String,
	include_tensor: bool,
	history: Option<Vec<PyRef<PyGameState>>>,
	) -> PyResult<String> {
	let mut room_info = std::collections::HashMap::new();
	room_info.insert("id".to_string(), room_id);
	room_info.insert("mode".to_string(), mode);

	let rs_history = history.map(\|h\| h.into_iter().map(\|gh\| gh.inner.clone()).collect());

	let std = StandardizedState::new(
	self.inner.clone(),
	&self.db.inner,
	room_info,
	include_tensor,
	rs_history,
	);

	serde_json::to_string(&std).map_err(\|e\| {
	pyo3::exceptions::PyValueError::new_err(format!("Serialization error: {}", e))
	})
	}

	#[getter]
	fn performance_results(&self) -> String {
	serde_json::to_string(&self.inner.ui.performance_results).unwrap_or_default()
	}

	#[getter]
	fn pending_card_id(&self) -> i32 {
	self.inner
	.interaction_stack
	.last()
	.map(\|p\| {
	if p.card_id >= 0 {
	p.card_id as i32
	} else {
	p.ctx.source_card_id as i32
	}
	})
	.unwrap_or(-1)
	}

	#[getter]
	fn pending_ab_idx(&self) -> i32 {
	self.inner
	.interaction_stack
	.last()
	.map(\|p\| p.ability_index as i32)
	.unwrap_or(-1)
	}

	#[getter]
	fn pending_effect_opcode(&self) -> i32 {
	self.inner
	.interaction_stack
	.last()
	.map(\|p\| p.effect_opcode as i32)
	.unwrap_or(-1)
	}

	#[getter]
	fn pending_choice_type(&self) -> String {
	self.inner
	.interaction_stack
	.last()
	.map(\|p\| p.choice_type.as_str().to_string())
	.unwrap_or_default()
	}

	#[getter]
	fn pending_choice_text(&self) -> String {
	self.inner
	.interaction_stack
	.last()
	.map(\|p\| p.choice_text.clone())
	.unwrap_or_default()
	}

	#[getter]
	fn yell_cards(&self) -> Vec<u32> {
	// Moved to GameState
	Vec::new()
	}

	#[setter]
	fn set_yell_cards(&mut self, _val: Vec<u32>) {
	// Moved to GameState
	}

	#[getter]
	fn pending_area_idx(&self) -> i32 {
	if let Some(pi) = self.inner.interaction_stack.last() {
	pi.ctx.area_idx as i32
	} else {
	-1
	}
	}

	#[getter]
	fn pending_player_id(&self) -> i32 {
	if let Some(pi) = self.inner.interaction_stack.last() {
	pi.ctx.player_id as i32
	} else {
	-1
	}
	}

	#[getter]
	fn last_performance_results(&self) -> String {
	serde_json::to_string(&self.inner.ui.last_performance_results)
	.unwrap_or_else(\|_\| "{}".to_string())
	}

	#[getter]
	fn performance_history(&self) -> String {
	serde_json::to_string(&self.inner.ui.performance_history)
	.unwrap_or_else(\|_\| "[]".to_string())
	}

	#[getter]
	fn pending_choices(&self) -> Vec<(String, String)> {
	use crate::core::enums::O_ACTIVATE_MEMBER;
	use crate::core::enums::O_COLOR_SELECT;
	use crate::core::enums::O_LOOK_AND_CHOOSE;
	use crate::core::enums::O_MOVE_MEMBER;
	use crate::core::enums::O_MOVE_TO_DISCARD;
	use crate::core::enums::O_OPPONENT_CHOOSE;
	use crate::core::enums::O_ORDER_DECK;
	use crate::core::enums::O_PLAY_MEMBER_FROM_HAND;
	use crate::core::enums::O_RECOVER_LIVE;
	use crate::core::enums::O_RECOVER_MEMBER;
	use crate::core::enums::O_REVEAL_CARDS;
	use crate::core::enums::O_SELECT_CARDS;
	use crate::core::enums::O_SELECT_MODE;
	use crate::core::enums::O_TAP_OPPONENT;

	let mut result = Vec::new();
	let op = self
	.inner
	.interaction_stack
	.last()
	.map(\|p\| p.effect_opcode)
	.unwrap_or(-1);

	let p_idx = if let Some(pi) = self.inner.interaction_stack.last() {
	pi.ctx.player_id as usize
	} else {
	self.inner.current_player as usize
	};

	let base_params = self
	.inner
	.interaction_stack
	.last()
	.map(\|pi\| {
	let source_card_id = if pi.card_id >= 0 {
	pi.card_id
	} else {
	pi.ctx.source_card_id
	};
	serde_json::json!({
	"source_card_id": source_card_id,
	"source_player": pi.ctx.player_id,
	"source_area": pi.ctx.area_idx,
	"area": pi.ctx.area_idx,
	"ability_index": pi.ability_index,
	"effect_opcode": pi.effect_opcode,
	"target_slot": pi.target_slot,
	"choice_text": pi.choice_text,
	})
	})
	.unwrap_or_else(\|\| serde_json::json!({}));

	if op == O_ORDER_DECK
	\|\| op == O_LOOK_AND_CHOOSE
	\|\| op == O_REVEAL_CARDS
	\|\| op == O_RECOVER_LIVE
	\|\| op == O_RECOVER_MEMBER
	{
	let looked = &self.inner.players[p_idx].looked_cards;
	let mut params = base_params;
	if let Some(obj) = params.as_object_mut() {
	obj.insert("cards".to_string(), serde_json::json!(looked));
	}
	let type_str = if op == O_ORDER_DECK {
	ChoiceType::OrderDeck.as_str()
	} else {
	"SELECT_FROM_LIST"
	};
	result.push((type_str.to_string(), params.to_string()));
	} else if op == O_TAP_OPPONENT {
	let mut params = base_params;
	if let Some(obj) = params.as_object_mut() {
	obj.insert(
	"target_player".to_string(),
	serde_json::json!(1 - self.inner.interaction_stack.last().map(\|pi\| pi.ctx.activator_id).unwrap_or(self.inner.current_player)),
	);
	}
	result.push(("TARGET_OPPONENT_MEMBER".to_string(), params.to_string()));
	} else if op == O_MOVE_MEMBER {
	result.push(("MOVE_MEMBER".to_string(), base_params.to_string()));
	} else if op == O_ACTIVATE_MEMBER {
	result.push(("TAP_MEMBER".to_string(), base_params.to_string()));
	} else if op == O_COLOR_SELECT {
	result.push((ChoiceType::ColorSelect.as_str().to_string(), base_params.to_string()));
	} else if op == O_MOVE_TO_DISCARD {
	result.push((ChoiceType::SelectHandDiscard.as_str().to_string(), base_params.to_string()));
	} else if op == O_PLAY_MEMBER_FROM_HAND {
	result.push((ChoiceType::SelectHandPlay.to_string(), base_params.to_string()));
	} else if op == O_SELECT_CARDS {
	result.push(("SELECT_FROM_LIST".to_string(), base_params.to_string()));
	} else if op == O_OPPONENT_CHOOSE {
	result.push((ChoiceType::OpponentChoose.to_string(), base_params.to_string()));
	} else if op == O_SELECT_MODE {
	// We might need to store the options in the state if we want better labels
	result.push((ChoiceType::SelectMode.to_string(), base_params.to_string()));
	}

	result
	}

	#[getter]
	fn pending_effects(&self) -> Vec<String> {
	Vec::new()
	}

	fn get_player(&self, idx: usize) -> PyResult<PyPlayerState> {
	if idx < 2 {
	Ok(PyPlayerState {
	inner: self.inner.players[idx].clone(),
	})
	} else {
	Err(pyo3::exceptions::PyIndexError::new_err(
	"Player index out of bounds",
	))
	}
	}

	fn initialize_game(
	&mut self,
	p0_deck: Vec<u32>,
	p1_deck: Vec<u32>,
	p0_energy: Vec<u32>,
	p1_energy: Vec<u32>,
	p0_lives: Vec<u32>,
	p1_lives: Vec<u32>,
	) {
	let p0_d: Vec<i32> = p0_deck.into_iter().map(\|x\| x as i32).collect();
	let p1_d: Vec<i32> = p1_deck.into_iter().map(\|x\| x as i32).collect();
	let p0_e: Vec<i32> = p0_energy.into_iter().map(\|x\| x as i32).collect();
	let p1_e: Vec<i32> = p1_energy.into_iter().map(\|x\| x as i32).collect();
	let p0_l: Vec<i32> = p0_lives.into_iter().map(\|x\| x as i32).collect();
	let p1_l: Vec<i32> = p1_lives.into_iter().map(\|x\| x as i32).collect();
	self.inner
	.initialize_game(p0_d, p1_d, p0_e, p1_e, p0_l, p1_l);
	}

	fn initialize_game_with_seed(
	&mut self,
	p0_deck: Vec<u32>,
	p1_deck: Vec<u32>,
	p0_energy: Vec<u32>,
	p1_energy: Vec<u32>,
	p0_lives: Vec<u32>,
	p1_lives: Vec<u32>,
	seed: u64,
	) {
	let p0_d: Vec<i32> = p0_deck.into_iter().map(\|x\| x as i32).collect();
	let p1_d: Vec<i32> = p1_deck.into_iter().map(\|x\| x as i32).collect();
	let p0_e: Vec<i32> = p0_energy.into_iter().map(\|x\| x as i32).collect();
	let p1_e: Vec<i32> = p1_energy.into_iter().map(\|x\| x as i32).collect();
	let p0_l: Vec<i32> = p0_lives.into_iter().map(\|x\| x as i32).collect();
	let p1_l: Vec<i32> = p1_lives.into_iter().map(\|x\| x as i32).collect();
	self.inner
	.initialize_game_with_seed(p0_d, p1_d, p0_e, p1_e, p0_l, p1_l, Some(seed));
	}

	fn get_legal_actions(&mut self) -> Vec<bool> {
	self.inner.get_legal_actions_into(
	&self.db.inner,
	self.inner.current_player as usize,
	&mut self.legal_action_buffer,
	);
	self.legal_action_buffer.clone()
	}

	fn get_legal_action_ids(&mut self) -> Vec<i32> {
	self.inner.get_legal_action_ids(&self.db.inner)
	}

	fn get_legal_action_ids_for_player(&mut self, p_idx: usize) -> Vec<i32> {
	self.inner
	.get_legal_action_ids_for_player(&self.db.inner, p_idx)
	}

	fn get_observation(&self) -> Vec<f32> {
	self.inner.get_observation(&self.db.inner)
	}

	pub fn to_alphazero_tensor(&self) -> Vec<f32> {
	self.inner.to_alphazero_tensor(&self.db.inner)
	}

	pub fn to_vanilla_tensor(&self) -> Vec<f32> {
	use crate::core::alphazero_encoding_vanilla::AlphaZeroVanillaEncoding;
	self.inner.to_vanilla_tensor(&self.db.inner)
	}
	}

	// Second #[pymethods] block — PyO3 abi3 has a per-block inventory limit
	#[pymethods]
	impl PyGameState {
	pub fn get_verbose_label(&self, action_id: i32) -> String {
	crate::core::logic::ActionFactory::get_verbose_action_label(
	action_id,
	&self.inner,
	&self.db.inner,
	)
	}

	pub fn test_method(&self) -> String {
	"test_ok_v3".to_string()
	}

	fn get_interaction(&self) -> Option<PyPendingInteraction> {
	self.inner
	.interaction_stack
	.last()
	.map(\|pi\| PyPendingInteraction {
	choice_type: pi.choice_type.as_str().to_string(),
	filter_attr: pi.filter_attr,
	ctx: format!("{:?}", pi.ctx),
	})
	}

	fn is_terminal(&self) -> bool {
	self.inner.phase == Phase::Terminal
	}

	fn get_winner(&self) -> i32 {
	self.inner.get_winner()
	}

	fn get_effective_blades(&self, p_idx: usize, slot_idx: usize) -> u32 {
	self.inner
	.get_effective_blades(p_idx, slot_idx, &self.db.inner, 0)
	}

	fn get_effective_hearts(&self, p_idx: usize, slot_idx: usize) -> [u8; 7] {
	self.inner
	.get_effective_hearts(p_idx, slot_idx, &self.db.inner, 0)
	.to_array()
	}

	fn get_total_blades(&self, p_idx: usize) -> u32 {
	self.inner.get_total_blades(p_idx, &self.db.inner, 0)
	}

	fn get_total_hearts(&self, p_idx: usize) -> [u32; 7] {
	self.inner
	.get_total_hearts(p_idx, &self.db.inner, 0)
	.to_array()
	.map(\|x\| x as u32)
	}

	fn get_member_cost(&self, p_idx: usize, card_id: i32, slot_idx: i32) -> i32 {
	self.inner
	.get_member_cost(p_idx, card_id, slot_idx as i16, -1, &self.db.inner, 0)
	}

	fn execute_mulligan(&mut self, player_idx: usize, discard_indices: Vec<usize>) {
	self.inner.execute_mulligan(player_idx, discard_indices);
	}

	fn step(&mut self, action: i32) -> PyResult<()> {
	let db = &self.db.inner;
	if self.inner.debug.debug_mode {
	self.inner.dump_diagnostics(db);
	}
	self.inner
	.step(db, action)
	.map_err(\|e\| pyo3::exceptions::PyValueError::new_err(e))
	}

	fn get_action_label(&self, action_id: i32) -> String {
	crate::core::logic::ActionFactory::get_action_label(action_id)
	}

	fn auto_step(&mut self, _db: &PyCardDatabase) {
	self.inner.auto_step(&self.db.inner);
	}

	fn debug_execute_bytecode(
	&mut self,
	bytecode: Vec<i32>,
	player_id: u8,
	area_idx: i32,
	source_card_id: i32,
	target_slot: i32,
	choice_index: i32,
	selected_color: i32,
	) {
	let db = &self.db.inner;
	let ctx = crate::core::logic::AbilityContext {
	player_id,
	activator_id: player_id,
	area_idx: area_idx as i16,
	source_card_id,
	target_card_id: -1,
	target_slot: target_slot as i16,
	choice_index: choice_index as i16,
	selected_color: selected_color as i16,
	program_counter: 0,
	ability_index: -1,
	v_remaining: -1,
	trigger_type: Default::default(),
	original_phase: None,
	original_current_player: None,
	repeat_count: 0,
	selected_cards: Vec::new(),
	v_accumulated: 0,
	auto_pick: false,
	};
	self.inner
	.resolve_bytecode(db, std::sync::Arc::new(bytecode), &ctx);
	}

	fn integrated_step(
	&mut self,
	action: i32,
	opp_mode: u8,
	mcts_sims: usize,
	enable_rollout: bool,
	) -> (f32, bool) {
	let db = &self.db.inner;
	self.inner
	.integrated_step(db, action, opp_mode, mcts_sims, enable_rollout)
	}

	#[pyo3(signature = (p0_sims, p1_sims, p0_heuristic_id, p1_heuristic_id, horizon=SearchHorizon::GameEnd(), p0_rollout=true, p1_rollout=true))]
	fn play_asymmetric_match(
	&mut self,
	p0_sims: usize,
	p1_sims: usize,
	p0_heuristic_id: i32,
	p1_heuristic_id: i32,
	horizon: SearchHorizon,
	p0_rollout: bool,
	p1_rollout: bool,
	) -> (i32, u32) {
	let db = &self.db.inner;
	self.inner.play_asymmetric_match(
	db,
	p0_sims,
	p1_sims,
	p0_heuristic_id,
	p1_heuristic_id,
	horizon,
	p0_rollout,
	p1_rollout,
	)
	}

	#[pyo3(signature = (p0_sims, p1_sims, p0_heuristic_id, p1_heuristic_id, horizon=SearchHorizon::GameEnd(), enable_rollout=true))]
	fn play_mirror_match(
	&mut self,
	p0_sims: usize,
	p1_sims: usize,
	p0_heuristic_id: i32,
	p1_heuristic_id: i32,
	horizon: SearchHorizon,
	enable_rollout: bool,
	) -> (i32, u32) {
	let db = &self.db.inner;
	self.inner.play_mirror_match(
	db,
	p0_sims,
	p1_sims,
	p0_heuristic_id,
	p1_heuristic_id,
	horizon,
	enable_rollout,
	)
	}

	fn step_opponent(&mut self) {
	let db = &self.db.inner;
	self.inner.step_opponent(db);
	}

	#[pyo3(signature = (sims, config=None))]
	fn step_opponent_mcts(&mut self, sims: usize, config: Option<HeuristicConfig>) {
	let db = &self.db.inner;
	let h = OriginalHeuristic {
	config: config.unwrap_or_default(),
	};
	self.inner.step_opponent_mcts(db, sims, &h);
	}

	#[pyo3(signature = (config=None))]
	fn step_opponent_greedy(&mut self, config: Option<HeuristicConfig>) {
	let db = &self.db.inner;
	let h = OriginalHeuristic {
	config: config.unwrap_or_default(),
	};
	self.inner.step_opponent_greedy(db, &h);
	}

	/// Execute opponent's full turn using TurnSequencer planner for vanilla mode.
	/// This uses the success-count-first heuristic optimized for lower turn counts.
	#[pyo3(signature = ())]
	fn step_opponent_turnseq(&mut self) {
	use crate::core::logic::turn_sequencer::TurnSequencer;
	let db = &self.db.inner;
	let (action_seq, _, _, _) = TurnSequencer::plan_full_turn(&self.inner, db);

	// Execute each action in the sequence until PASS or game ends
	for &action in &action_seq {
	if self.inner.is_terminal() {
	break;
	}
	if let Err(_) = self.inner.step(db, action) {
	break;
	}
	}
	}

	#[pyo3(signature = (_db, p_idx, heuristic_id, config=None))]
	fn get_greedy_action(
	&mut self,
	_db: &PyCardDatabase,
	p_idx: usize,
	heuristic_id: i32,
	config: Option<HeuristicConfig>,
	) -> i32 {
	let db = &self.db.inner;
	let cfg = config.unwrap_or_default();
	match heuristic_id {
	1 => self
	.inner
	.get_greedy_action(db, p_idx, &LegacyHeuristic { config: cfg }),
	2 => self
	.inner
	.get_greedy_action(db, p_idx, &LegacyHeuristic { config: cfg }),
	_ => self
	.inner
	.get_greedy_action(db, p_idx, &OriginalHeuristic { config: cfg }),
	}
	}

	#[pyo3(signature = (_db, p_idx, heuristic_id, config=None))]
	fn get_greedy_evaluations(
	&mut self,
	_db: &PyCardDatabase,
	p_idx: usize,
	heuristic_id: i32,
	config: Option<HeuristicConfig>,
	) -> Vec<(i32, f32)> {
	let db = &self.db.inner;
	let cfg = config.unwrap_or_default();
	match heuristic_id {
	1 => self
	.inner
	.get_greedy_evaluations(db, p_idx, &LegacyHeuristic { config: cfg }),
	2 => self
	.inner
	.get_greedy_evaluations(db, p_idx, &LegacyHeuristic { config: cfg }),
	_ => self
	.inner
	.get_greedy_evaluations(db, p_idx, &OriginalHeuristic { config: cfg }),
	}
	}

	#[pyo3(signature = (heuristic_id, baseline_score0=0, baseline_score1=0, config=None))]
	fn evaluate(
	&self,
	heuristic_id: i32,
	baseline_score0: u32,
	baseline_score1: u32,
	config: Option<HeuristicConfig>,
	) -> f32 {
	let db = &self.db.inner;
	let cfg = config.unwrap_or_default();
	match heuristic_id {
	1 => self.inner.evaluate(
	db,
	baseline_score0,
	baseline_score1,
	EvalMode::Normal,
	&LegacyHeuristic { config: cfg },
	),
	2 => self.inner.evaluate(
	db,
	baseline_score0,
	baseline_score1,
	EvalMode::Normal,
	&LegacyHeuristic { config: cfg },
	),
	_ => self.inner.evaluate(
	db,
	baseline_score0,
	baseline_score1,
	EvalMode::Normal,
	&OriginalHeuristic { config: cfg },
	),
	}
	}

	#[pyo3(signature = (sims, timeout_sec=0.0, horizon=SearchHorizon::GameEnd(), eval_mode=EvalMode::Blind))]
	fn get_mcts_suggestions(
	&mut self,
	sims: usize,
	timeout_sec: f32,
	horizon: SearchHorizon,
	eval_mode: EvalMode,
	) -> Vec<(i32, f32, u32)> {
	let db = &self.db.inner;
	self.inner
	.get_mcts_suggestions(db, sims, timeout_sec, horizon, eval_mode)
	}

	#[pyo3(signature = (sims, timeout_sec=0.0, horizon=SearchHorizon::GameEnd(), eval_mode=EvalMode::Blind, config=None))]
	fn get_mcts_suggestions_with_config(
	&mut self,
	sims: usize,
	timeout_sec: f32,
	horizon: SearchHorizon,
	eval_mode: EvalMode,
	config: Option<HeuristicConfig>,
	) -> Vec<(i32, f32, u32)> {
	let db = &self.db.inner;
	let h = OriginalHeuristic {
	config: config.unwrap_or_default(),
	};
	self.inner
	.get_mcts_suggestions_ext(db, sims, timeout_sec, horizon, eval_mode, &h)
	}

	#[pyo3(signature = (sims, evaluator, batch_size=16))]
	fn search_mcts_alphazero(
	&mut self,
	sims: usize,
	evaluator: &PyAlphaZeroEvaluator,
	batch_size: usize,
	) -> Vec<(i32, f32, u32)> {
	let db = &self.db.inner;
	let mut mcts = MCTS::with_evaluator(evaluator.evaluator.clone(), batch_size);
	let h = OriginalHeuristic::default();
	let (suggestions, _profiler) = mcts.search(
	&self.inner,
	db,
	sims,
	0.0,
	SearchHorizon::GameEnd(),
	&h,
	);
	suggestions
	}

	#[setter]
	fn set_phase(&mut self, val: i8) {
	self.inner.phase = match val {
	-1 => Phase::MulliganP1,
	0 => Phase::MulliganP2,
	1 => Phase::Active,
	2 => Phase::Energy,
	3 => Phase::Draw,
	4 => Phase::Main,
	5 => Phase::LiveSet,
	6 => Phase::PerformanceP1,
	7 => Phase::PerformanceP2,
	8 => Phase::LiveResult,
	9 => Phase::Terminal,
	10 => Phase::Response,
	_ => Phase::Setup,
	};
	}

	fn set_player(&mut self, idx: usize, player: PyPlayerState) -> PyResult<()> {
	if idx < 2 {
	self.inner.log(format!(
	"set_player {}: Discard len = {}",
	idx,
	player.inner.discard.len()
	));
	self.inner.players[idx] = player.inner;
	Ok(())
	} else {
	Err(pyo3::exceptions::PyIndexError::new_err(
	"Player index out of bounds",
	))
	}
	}

	fn set_stage_card(&mut self, p_idx: usize, slot_idx: usize, card_id: i32) {
	if p_idx < 2 && slot_idx < STAGE_SLOT_COUNT {
	self.inner.players[p_idx].stage[slot_idx] = card_id;
	}
	}

	fn set_live_card(&mut self, p_idx: usize, slot_idx: usize, card_id: i32, revealed: bool) {
	if p_idx < 2 && slot_idx < STAGE_SLOT_COUNT {
	self.inner.players[p_idx].live_zone[slot_idx] = card_id;
	self.inner.players[p_idx].set_revealed(slot_idx, revealed);
	}
	}

	fn set_hand_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	self.inner.players[p_idx].hand = cards.into_iter().map(\|x\| x as i32).collect();
	self.inner.players[p_idx].hand_added_turn =
	SmallVec::from_vec(vec![
	self.inner.turn as i32;
	self.inner.players[p_idx].hand.len()
	]);
	}
	}

	fn set_discard_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	self.inner.players[p_idx].discard = cards.into_iter().map(\|x\| x as i32).collect();
	}
	}

	fn set_revealed_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	// looked_cards is the shared buffer for revealing cards in the engine
	self.inner.players[p_idx].looked_cards = cards.into_iter().map(\|x\| x as i32).collect();
	}
	}

	fn set_deck_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	self.inner.players[p_idx].deck = cards.into_iter().map(\|x\| x as i32).collect();
	}
	}

	fn set_energy_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	self.inner.players[p_idx].energy_zone = cards.into_iter().map(\|x\| x as i32).collect();
	// Initialize tapped_energy if needed (reset mask)
	self.inner.players[p_idx].tapped_energy_mask = 0;
	}
	}

	fn set_live_cards(&mut self, p_idx: usize, cards: Vec<u32>) {
	if p_idx < 2 {
	for (i, &cid) in cards.iter().enumerate().take(3) {
	self.inner.players[p_idx].live_zone[i] = cid as i32;
	}
	}
	}

	fn resolve_bytecode(&mut self, bytecode: Vec<i32>, player_id: u8, _area_idx: i32) {
	let ctx = crate::core::logic::AbilityContext {
	player_id,
	activator_id: player_id,
	target_card_id: -1,
	original_phase: None,
	..crate::core::logic::AbilityContext::default()
	};
	self.inner
	.resolve_bytecode(&self.db.inner, std::sync::Arc::new(bytecode), &ctx);
	}

	fn trigger_abilities(&mut self, trigger: i32, player_id: u8) {
	let trigger_type =
	unsafe { std::mem::transmute::<i8, crate::core::enums::TriggerType>(trigger as i8) };
	let ctx = crate::core::logic::AbilityContext {
	player_id,
	activator_id: player_id,
	target_card_id: -1,
	trigger_type: crate::core::enums::TriggerType::None,
	..Default::default()
	};
	self.inner
	.trigger_abilities(&self.db.inner, trigger_type, &ctx);
	}

	fn trigger_ability_on_card(
	&mut self,
	_player_id: u8,
	_card_id: i32,
	slot_idx: i32,
	ab_idx: i32,
	) -> PyResult<()> {
	let db = &self.db.inner;
	self.inner
	.activate_ability(db, slot_idx as usize, ab_idx as usize)
	.map_err(\|e\| pyo3::exceptions::PyValueError::new_err(e))
	}

	fn clear_once_per_turn_flags(&mut self, p_idx: usize) {
	if p_idx < 2 {
	self.inner.players[p_idx].used_abilities.clear();
	}
	}

	fn start_turn(&mut self) {
	self.inner.do_active_phase(&self.db.inner);
	}

	#[pyo3(signature = (num_sims=0, seconds=0.0, heuristic_type="original", horizon=SearchHorizon::GameEnd(), eval_mode=EvalMode::Blind, config=None, _model_path=None))]
	fn search_mcts(
	&self,
	num_sims: usize,
	seconds: f32,
	heuristic_type: &str,
	horizon: SearchHorizon,
	eval_mode: EvalMode,
	config: Option<HeuristicConfig>,
	_model_path: Option<&str>,
	) -> Vec<(i32, f32, u32)> {
	let cfg = config.unwrap_or_default();
	if heuristic_type == "resnet" \|\| heuristic_type == "hybrid" {
	// ... (keeping NN logic simplified for now as it's less commonly used in diagnostics)
	#[cfg(not(feature = "nn"))]
	{
	let mcts = crate::core::mcts::MCTS::new();
	let h = OriginalHeuristic { config: cfg };
	return mcts.search_parallel(
	&self.inner,
	&self.db.inner,
	num_sims,
	seconds,
	horizon,
	&h,
	eval_mode == EvalMode::Blind,
	);
	}
	}

	let mcts = crate::core::mcts::MCTS::new();
	match heuristic_type {
	"legacy" => {
	let h = LegacyHeuristic { config: cfg };
	mcts.search_parallel(
	&self.inner,
	&self.db.inner,
	num_sims,
	seconds,
	horizon,
	&h,
	eval_mode == EvalMode::Blind,
	)
	}
	_ => {
	let h = OriginalHeuristic { config: cfg };
	mcts.search_parallel(
	&self.inner,
	&self.db.inner,
	num_sims,
	seconds,
	horizon,
	&h,
	eval_mode == EvalMode::Blind,
	)
	}
	}
	}

	#[pyo3(signature = (db, num_games))]
	pub fn sim_random_games(&self, db: &PyCardDatabase, num_games: usize) -> PyObject {
	let mut rng = SmallRng::from_os_rng();
	let mut total_moves = 0;
	let mut total_meaningful_moves = 0;
	let mut gameplay_seconds = 0.0;
	let mut action_stats: std::collections::HashMap<String, (u64, f64)> = std::collections::HashMap::new();

	for _ in 0..num_games {
	let mut state = self.inner.clone();
	state.ui.silent = true;

	let start = std::time::Instant::now();
	while state.phase != crate::core::logic::Phase::Terminal {
	let mut actions = SmallVec::<[i32; 64]>::new();
	state.generate_legal_actions(&db.inner, state.current_player as usize, &mut actions);

	let action = if actions.is_empty() {
	0
	} else {
	*actions.choose(&mut rng).unwrap()
	};

	let step_start = std::time::Instant::now();
	let _ = state.step(&db.inner, action);
	let step_duration = step_start.elapsed().as_secs_f64();

	let label = crate::core::logic::ActionFactory::get_action_label(action);
	// Categorize label to keep the map size reasonable
	let category = if label.contains("Mulligan") {
	"Mulligan".to_string()
	} else if label.contains("Set Live") {
	"SetLive".to_string()
	} else if label.contains("Play Hand") {
	"PlayMember".to_string()
	} else if label.contains("Activate Member") {
	"ActivateMember".to_string()
	} else if label.contains("Activate from Hand") {
	"ActivateFromHand".to_string()
	} else if label.contains("Activate from Discard") {
	"ActivateFromDiscard".to_string()
	} else if label.contains("Pass") {
	"Pass".to_string()
	} else if label.contains("Select Mode") {
	"SelectMode".to_string()
	} else if label.contains("Select Color") {
	"SelectColor".to_string()
	} else if label.contains("Select Stage Slot")
	\|\| label.contains("Select Left Slot")
	\|\| label.contains("Select Mid Slot")
	\|\| label.contains("Select Right Slot")
	{
	"SelectStageSlot".to_string()
	} else if label.contains("Select Choice") {
	"SelectChoice".to_string()
	} else if label.contains("Turn Choice") {
	"TurnChoice".to_string()
	} else {
	label
	};

	let entry = action_stats.entry(category).or_insert((0, 0.0));
	entry.0 += 1;
	entry.1 += step_duration;

	total_moves += 1;
	if action != 0 {
	total_meaningful_moves += 1;
	}

	if total_moves > 1000000 {
	// Safety break for extreme cases
	break;
	}
	}
	gameplay_seconds += start.elapsed().as_secs_f64();
	}

	Python::with_gil(\|py\| {
	let mps = if gameplay_seconds > 0.0 { total_moves as f64 / gameplay_seconds } else { 0.0 };

	let mut timing_breakdown = std::collections::HashMap::new();
	for (cat, (count, total_time)) in action_stats {
	timing_breakdown.insert(cat, json!({
	"count": count,
	"total_time": total_time,
	"avg_time": if count > 0 { total_time / count as f64 } else { 0.0 }
	}));
	}

	let results = json!({
	"total_games": num_games,
	"total_moves": total_moves,
	"total_meaningful_moves": total_meaningful_moves,
	"gameplay_seconds": gameplay_seconds,
	"mps": mps,
	"action_timings": timing_breakdown,
	});
	let json_str = results.to_string();
	let json_mod = py.import("json").unwrap();
	json_mod.call_method1("loads", (json_str,)).unwrap().to_object(py)
	})
	}

	#[pyo3(signature = (db))]
	pub fn plan_full_turn(&self, db: &PyCardDatabase) -> (Vec<(i32, f32, f32, f32)>, Vec<i32>, usize, (f32, f32)) {
	use crate::core::logic::turn_sequencer::TurnSequencer;
	let (seq, _val, breakdown, nodes) = TurnSequencer::plan_full_turn(&self.inner, &db.inner);
	(Vec::new(), seq, nodes, breakdown)
	}

	#[pyo3(signature = (db))]
	pub fn plan_full_turn_with_stats(&self, db: &PyCardDatabase) -> (Vec<(i32, f32, f32, f32)>, Vec<i32>, usize, f32, (f32, f32)) {
	use crate::core::logic::turn_sequencer::TurnSequencer;
	TurnSequencer::plan_full_turn_with_stats(&self.inner, &db.inner)
	}

	#[pyo3(signature = (db))]
	pub fn find_best_liveset_selection(&self, db: &PyCardDatabase) -> (Vec<i32>, usize, u128) {
	use crate::core::logic::turn_sequencer::TurnSequencer;
	TurnSequencer::find_best_liveset_selection(&self.inner, &db.inner)
	}

	#[pyo3(signature = (db, p_idx))]
	pub fn get_score_breakdown(
	&self,
	db: &PyCardDatabase,
	p_idx: usize,
	) -> (f32, f32, f32, f32, f32, f32, f32) {
	use crate::core::logic::turn_sequencer::TurnSequencer;
	let brk = TurnSequencer::get_score_breakdown(&self.inner, &db.inner, p_idx);
	(
	brk.board_score,
	brk.live_ev,
	brk.success_val,
	brk.win_bonus,
	brk.hand_momentum,
	brk.cycling_bonus,
	brk.total,
	)
	}
	}

	#[pyclass]
	pub struct PyVectorGameState {
	envs: Vec<GameState>,
	db: PyCardDatabase,
	p0_deck: Vec<u32>,
	p1_deck: Vec<u32>,
	p0_lives: Vec<u32>,
	p1_lives: Vec<u32>,
	seeds: Vec<u64>,
	opp_mode: u8,
	mcts_sims: usize,
	}

	#[pymethods]
	impl PyVectorGameState {
	#[new]
	#[pyo3(signature = (num_envs, db, opp_mode=0, mcts_sims=50))]
	fn new(num_envs: usize, db: PyCardDatabase, opp_mode: u8, mcts_sims: usize) -> Self {
	let mut envs = Vec::with_capacity(num_envs);
	for _ in 0..num_envs {
	envs.push(GameState::default());
	}
	Self {
	envs,
	db,
	p0_deck: Vec::new(),
	p1_deck: Vec::new(),
	p0_lives: Vec::new(),
	p1_lives: Vec::new(),
	seeds: vec![0; num_envs],
	opp_mode,
	mcts_sims,
	}
	}

	fn initialize(
	&mut self,
	p0_deck: Vec<u32>,
	p1_deck: Vec<u32>,
	p0_lives: Vec<u32>,
	p1_lives: Vec<u32>,
	seed: u64,
	) {
	self.p0_deck = p0_deck;
	self.p1_deck = p1_deck;
	self.p0_lives = p0_lives;
	self.p1_lives = p1_lives;

	let num_envs = self.envs.len();
	for i in 0..num_envs {
	self.seeds[i] = seed + i as u64;
	}

	self.envs.par_iter_mut().enumerate().for_each(\|(i, env)\| {
	env.initialize_game_with_seed(
	self.p0_deck.iter().map(\|&x\| x as i32).collect(),
	self.p1_deck.iter().map(\|&x\| x as i32).collect(),
	Vec::new(),
	Vec::new(),
	self.p0_lives.iter().map(\|&x\| x as i32).collect(),
	self.p1_lives.iter().map(\|&x\| x as i32).collect(),
	Some(self.seeds[i]),
	);
	});
	}

	#[allow(clippy::too_many_arguments)]
	fn step<'py>(
	&mut self,
	_py: Python<'py>,
	actions: PyReadonlyArray1<'py, i32>,
	obs_out: &Bound<'py, PyArray2<f32>>,
	rewards_out: &Bound<'py, PyArray1<f32>>,
	dones_out: &Bound<'py, PyArray1<bool>>,
	term_obs_out: &Bound<'py, PyArray2<f32>>,
	) -> PyResult<Vec<usize>> {
	let actions = actions.as_slice()?;
	let obs_slice = unsafe { obs_out.as_slice_mut()? };
	let rewards_slice = unsafe { rewards_out.as_slice_mut()? };
	let dones_slice = unsafe { dones_out.as_slice_mut()? };
	let term_obs_slice = unsafe { term_obs_out.as_slice_mut()? };

	let num_envs = self.envs.len();
	let db = &self.db.inner;
	let obs_dim = 320;

	if actions.len() != num_envs {
	return Err(pyo3::exceptions::PyValueError::new_err(
	"Action dim mismatch",
	));
	}

	// 1. Step
	let opp_mode = self.opp_mode;
	let mcts_sims = self.mcts_sims;
	let results: Vec<(f32, bool)> = self
	.envs
	.par_iter_mut()
	.zip(actions.par_iter())
	.map(\|(env, &act)\| env.integrated_step(db, act, opp_mode, mcts_sims, true))
	.collect();

	results
	.par_iter()
	.zip(rewards_slice.par_iter_mut())
	.zip(dones_slice.par_iter_mut())
	.for_each(\|((&(r, d), r_out), d_out)\| {
	*r_out = r;
	*d_out = d;
	});

	// 2. Filter Done
	let mut done_indices = Vec::with_capacity(num_envs / 10);
	for (i, &(_, done)) in results.iter().enumerate() {
	if done {
	done_indices.push(i);
	}
	}

	// 3. Write Terminal Obs (Before Reset)
	if !done_indices.is_empty() {
	term_obs_slice
	.par_chunks_mut(obs_dim)
	.zip(done_indices.par_iter())
	.for_each(\|(chunk, &env_idx)\| {
	self.envs[env_idx].write_observation(db, chunk);
	});
	}

	// 4. Auto-Reset
	let p0_deck = &self.p0_deck;
	let p1_deck = &self.p1_deck;
	let p0_lives = &self.p0_lives;
	let p1_lives = &self.p1_lives;

	self.envs
	.par_iter_mut()
	.zip(results.par_iter())
	.for_each(\|(env, &(_, done))\| {
	if done {
	env.initialize_game_with_seed(
	p0_deck.iter().map(\|&x\| x as i32).collect(),
	p1_deck.iter().map(\|&x\| x as i32).collect(),
	Vec::new(),
	Vec::new(),
	p0_lives.iter().map(\|&x\| x as i32).collect(),
	p1_lives.iter().map(\|&x\| x as i32).collect(),
	None,
	);
	}
	});

	// 5. Write Final Obs
	obs_slice
	.par_chunks_mut(obs_dim)
	.zip(self.envs.par_iter())
	.for_each(\|(chunk, env)\| {
	env.write_observation(db, chunk);
	});

	Ok(done_indices)
	}

	// New: Zero-Copy get_observations
	fn get_observations<'py>(
	&self,
	_py: Python<'py>,
	out: &Bound<'py, PyArray2<f32>>,
	) -> PyResult<()> {
	let db = &self.db.inner;
	let obs_dim = 320;
	let obs_slice = unsafe { out.as_slice_mut()? };

	obs_slice
	.par_chunks_mut(obs_dim)
	.zip(self.envs.par_iter())
	.for_each(\|(chunk, env)\| {
	env.write_observation(db, chunk);
	});
	Ok(())
	}

	// New: Zero-Copy get_action_masks
	fn get_action_masks<'py>(
	&self,
	_py: Python<'py>,
	out: &Bound<'py, PyArray2<bool>>,
	) -> PyResult<()> {
	let db = &self.db.inner;
	let action_dim = crate::core::logic::ACTION_SPACE;
	let mask_slice = unsafe { out.as_slice_mut()? };

	mask_slice
	.par_chunks_mut(action_dim)
	.zip(self.envs.par_iter())
	.for_each(\|(chunk, env)\| {
	env.get_legal_actions_into(db, env.current_player as usize, chunk);
	});
	Ok(())
	}
	}

	#[cfg(feature = "nn")]
	#[pyclass]
	pub struct PyHybridMCTS {
	pub session: std::sync::Arc<std::sync::Mutex<ort::session::Session>>,
	pub neural_weight: f32,
	pub skip_rollout: bool,
	}

	#[cfg(feature = "nn")]
	#[pymethods]
	impl PyHybridMCTS {
	#[new]
	#[pyo3(signature = (model_path, neural_weight=0.3, skip_rollout=false))]
	fn new(model_path: &str, neural_weight: f32, skip_rollout: bool) -> PyResult<Self> {
	let session = ort::session::Session::builder()
	.map_err(\|e: ort::Error\| pyo3::exceptions::PyValueError::new_err(e.to_string()))?
	.commit_from_file(model_path)
	.map_err(\|e: ort::Error\| pyo3::exceptions::PyValueError::new_err(e.to_string()))?;
	Ok(Self {
	session: std::sync::Arc::new(std::sync::Mutex::new(session)),
	neural_weight,
	skip_rollout,
	})
	}

	#[pyo3(signature = (game, num_sims=0, seconds=0.0))]
	fn get_suggestions(
	&mut self,
	game: &mut PyGameState,
	num_sims: usize,
	seconds: f32,
	) -> Vec<(i32, f32, u32)> {
	let mut mcts = crate::core::mcts::HybridMCTS::new(
	self.session.clone(),
	self.neural_weight,
	self.skip_rollout,
	);
	mcts.get_suggestions(&game.inner, &game.db.inner, num_sims, seconds)
	}
	}

	// AlphaZero Tensor Type Enum
	#[pyclass(eq, eq_int)]
	#[derive(Clone, Copy, PartialEq, Eq, Debug, Default)]
	pub enum AlphaZeroTensorType {
	#[default]
	Vanilla = 0,
	Original = 1,
	}

	// PyAlphaZeroEvaluator wrapper for network-guided MCTS
	#[pyclass]
	pub struct PyAlphaZeroEvaluator {
	evaluator: Arc<Box<dyn AlphaZeroEvaluator>>,
	}

	#[pymethods]
	impl PyAlphaZeroEvaluator {
	#[new]
	fn new(model: PyObject, tensor_type: AlphaZeroTensorType) -> Self {
	#[cfg(feature = "extension-module")]
	{
	let tensor_encoding = match tensor_type {
	AlphaZeroTensorType::Vanilla => crate::core::alphazero_evaluator::PythonTensorEncoding::Vanilla,
	AlphaZeroTensorType::Original => crate::core::alphazero_evaluator::PythonTensorEncoding::Original,
	};
	let evaluator_impl = crate::core::alphazero_evaluator::PyAlphaZeroEvaluator::new(model, tensor_encoding);
	Self {
	evaluator: Arc::new(Box::new(evaluator_impl)),
	}
	}
	#[cfg(not(feature = "extension-module"))]
	{
	panic!("PyAlphaZeroEvaluator requires extension-module feature");
	}
	}
	}

	pub fn register_python_module(m: &Bound<'_, PyModule>) -> PyResult<()> {
	m.add_class::<PyPlayerState>()?;
	m.add_class::<PyGameState>()?;
	m.add_class::<PyVectorGameState>()?;
	m.add_class::<PyCardDatabase>()?;
	m.add_class::<PyPendingInteraction>()?;
	#[cfg(feature = "nn")]
	m.add_class::<PyHybridMCTS>()?;
	m.add_class::<SearchHorizon>()?;
	m.add_class::<EvalMode>()?;
	m.add_class::<HeuristicConfig>()?;
	m.add_class::<AlphaZeroTensorType>()?;
	m.add_class::<PyAlphaZeroEvaluator>()?;
	Ok(())
	}