Spaces:

atomind
/

mlip-arena

Running

Yuan (Cyrus) Chiang

Add eSEN EOS (#59, #56)

3397e50 unverified 10 days ago

4.51 kB

	# import functools
	from pathlib import Path

	import pandas as pd
	from ase import Atoms
	from ase.db import connect
	from dask.distributed import Client
	from dask_jobqueue import SLURMCluster
	from prefect import flow, task
	from prefect.cache_policies import INPUTS, TASK_SOURCE
	from prefect.runtime import task_run
	from prefect_dask import DaskTaskRunner

	from mlip_arena.models import REGISTRY, MLIPEnum
	from mlip_arena.tasks.utils import get_calculator


	@task
	def load_wbm_structures():
	"""
	Load the WBM structures from an ASE database file.

	Reads structures from 'wbm_structures.db' and yields them as ASE Atoms objects
	with additional metadata preserved from the database.

	Yields:
	ase.Atoms: Individual atomic structures from the WBM database with preserved
	metadata in the .info dictionary.
	"""
	with connect("../wbm_structures.db") as db:
	for row in db.select():
	yield row.toatoms(add_additional_information=True)


	# def save_result(
	# tsk: Task,
	# run: TaskRun,
	# state: State,
	# model_name: str,
	# id: str,
	# ):
	# result = run.state.result()

	# assert isinstance(result, dict)

	# result["method"] = model_name
	# result["id"] = id
	# result.pop("atoms", None)

	# fpath = Path(f"{model_name}")
	# fpath.mkdir(exist_ok=True)

	# fpath = fpath / f"{result['id']}.pkl"

	# df = pd.DataFrame([result])
	# df.to_pickle(fpath)


	@task(
	name="EOS bulk - WBM",
	task_run_name=lambda: f"{task_run.task_name}: {task_run.parameters['atoms'].get_chemical_formula()} - {task_run.parameters['model'].name}",
	cache_policy=TASK_SOURCE + INPUTS,
	)
	def eos_bulk(atoms: Atoms, model: MLIPEnum):

	from mlip_arena.tasks.eos import run as EOS
	from mlip_arena.tasks.optimize import run as OPT

	calculator = get_calculator(
	model
	) # avoid sending entire model over prefect and select freer GPU

	result = OPT.with_options(
	refresh_cache=True,
	)(
	atoms,
	calculator,
	optimizer="FIRE",
	criterion=dict(
	fmax=0.1,
	),
	)
	result = EOS.with_options(
	refresh_cache=True,
	# on_completion=[functools.partial(
	# save_result,
	# model_name=model.name,
	# id=atoms.info["key_value_pairs"]["wbm_id"],
	# )],
	)(
	atoms=result["atoms"],
	calculator=calculator,
	optimizer="FIRE",
	npoints=21,
	max_abs_strain=0.2,
	concurrent=False
	)

	result["method"] = model.name
	result["id"] = atoms.info["key_value_pairs"]["wbm_id"]
	result.pop("atoms", None)

	fpath = Path(f"{model.name}")
	fpath.mkdir(exist_ok=True)

	fpath = fpath / f"{result['id']}.pkl"

	df = pd.DataFrame([result])
	df.to_pickle(fpath)

	return df


	@flow
	def submit_tasks():
	futures = []
	for atoms in load_wbm_structures():
	model = MLIPEnum["eSEN"]
	# for model in MLIPEnum:
	if "eos_bulk" not in REGISTRY[model.name].get("gpu-tasks", []):
	continue
	try:
	result = eos_bulk.with_options(
	refresh_cache=True
	).submit(atoms, model)
	futures.append(result)
	except Exception:
	# print(f"Failed to submit task for {model.name}: {e}")
	continue
	return [f.result(raise_on_failure=False) for f in futures]


	if __name__ == "__main__":
	nodes_per_alloc = 1
	gpus_per_alloc = 1
	ntasks = 1

	cluster_kwargs = dict(
	cores=1,
	memory="64 GB",
	shebang="#!/bin/bash",
	account="m3828",
	walltime="00:30:00",
	job_mem="0",
	job_script_prologue=[
	"source ~/.bashrc",
	"module load python",
	"module load cudatoolkit/12.4",
	"source activate /pscratch/sd/c/cyrusyc/.conda/dev",
	],
	job_directives_skip=["-n", "--cpus-per-task", "-J"],
	job_extra_directives=[
	"-J eos_bulk",
	"-q regular",
	f"-N {nodes_per_alloc}",
	"-C gpu",
	f"-G {gpus_per_alloc}",
	# "--exclusive",
	],
	)

	cluster = SLURMCluster(**cluster_kwargs)
	print(cluster.job_script())
	cluster.adapt(minimum_jobs=50, maximum_jobs=50)
	client = Client(cluster)

	submit_tasks.with_options(
	task_runner=DaskTaskRunner(address=client.scheduler.address),
	log_prints=True,
	)()