Spaces:

atomind
/

mlip-arena

Running

Yuan (Cyrus) Chiang

Add bulk EOS and E-V scanning benchmark (#56)

75ac94f 22 days ago

3.16 kB

	import functools
	from pathlib import Path

	import pandas as pd
	from ase.db import connect
	from dask.distributed import Client
	from dask_jobqueue import SLURMCluster
	from prefect import Task, flow, task
	from prefect.client.schemas.objects import TaskRun
	from prefect.states import State
	from prefect_dask import DaskTaskRunner

	from mlip_arena.models import REGISTRY, MLIPEnum
	from mlip_arena.tasks.eos import run as EOS
	from mlip_arena.tasks.optimize import run as OPT
	from mlip_arena.tasks.utils import get_calculator


	@task
	def load_wbm_structures():
	"""
	Load the WBM structures from a ASE DB file.
	"""
	with connect("../wbm_structures.db") as db:
	for row in db.select():
	yield row.toatoms(add_additional_information=True)


	def save_result(
	tsk: Task,
	run: TaskRun,
	state: State,
	model_name: str,
	id: str,
	):
	result = run.state.result()

	assert isinstance(result, dict)

	result["method"] = model_name
	result["id"] = id
	result.pop("atoms", None)

	fpath = Path(f"{model_name}")
	fpath.mkdir(exist_ok=True)

	fpath = fpath / f"{result['id']}.pkl"

	df = pd.DataFrame([result])
	df.to_pickle(fpath)


	@task
	def eos_bulk(atoms, model):

	calculator = get_calculator(
	model
	) # avoid sending entire model over prefect and select freer GPU

	result = OPT.with_options(
	refresh_cache=True,
	)(
	atoms,
	calculator,
	optimizer="FIRE",
	criterion=dict(
	fmax=0.1,
	),
	)

	return EOS.with_options(
	refresh_cache=True,
	on_completion=[functools.partial(
	save_result,
	model_name=model.name,
	id=atoms.info["key_value_pairs"]["wbm_id"],
	)],
	)(
	atoms=result["atoms"],
	calculator=calculator,
	optimizer="FIRE",
	npoints=21,
	max_abs_strain=0.2,
	concurrent=False
	)


	@flow
	def run_all():
	futures = []
	for atoms in load_wbm_structures():
	for model in MLIPEnum:
	if "eos_bulk" not in REGISTRY[model.name].get("gpu-tasks", []):
	continue
	result = eos_bulk.submit(atoms, model)
	futures.append(result)
	return [f.result(raise_on_failure=False) for f in futures]


	nodes_per_alloc = 1
	gpus_per_alloc = 1
	ntasks = 1

	cluster_kwargs = dict(
	cores=4,
	memory="64 GB",
	shebang="#!/bin/bash",
	account="m3828",
	walltime="00:50:00",
	job_mem="0",
	job_script_prologue=[
	"source ~/.bashrc",
	"module load python",
	"source activate /pscratch/sd/c/cyrusyc/.conda/mlip-arena",
	],
	job_directives_skip=["-n", "--cpus-per-task", "-J"],
	job_extra_directives=[
	"-J eos_bulk",
	"-q regular",
	f"-N {nodes_per_alloc}",
	"-C gpu",
	f"-G {gpus_per_alloc}",
	"--exclusive",
	],
	)

	cluster = SLURMCluster(**cluster_kwargs)
	print(cluster.job_script())
	cluster.adapt(minimum_jobs=20, maximum_jobs=40)
	client = Client(cluster)

	run_all.with_options(
	task_runner=DaskTaskRunner(address=client.scheduler.address),
	log_prints=True,
	)()