Space 관리하기
이 가이드에서는 huggingface_hub
를 사용하여 Space 런타임(보안 정보, 하드웨어 및 저장소)를 관리하는 방법을 살펴보겠습니다.
간단한 예제: 보안 정보 및 하드웨어 구성하기.
다음은 Hub에서 Space를 생성하고 설정하는 통합 예시입니다.
1. Hub에 Space 생성하기.
>>> from huggingface_hub import HfApi
>>> repo_id = "Wauplin/my-cool-training-space"
>>> api = HfApi()
# Gradio SDK 예제
>>> api.create_repo(repo_id=repo_id, repo_type="space", space_sdk="gradio")
1. (bis) Space 복제하기.
기존의 Space에서부터 시작하는 대신 새로운 Space를 구축하고 싶을 때 유용할 수 있습니다. 또한 공개된 Space의 구성/설정을 제어하고 싶을 때도 유용합니다. 자세한 내용은 duplicate_space()를 참조하세요.
>>> api.duplicate_space("multimodalart/dreambooth-training")
2. 선호하는 솔루션을 사용하여 코드 업로드하기.
다음은 로컬 폴더 src/
를 사용자의 컴퓨터에서 Space로 업로드하는 예시입니다:
>>> api.upload_folder(repo_id=repo_id, repo_type="space", folder_path="src/")
이 단계에서는 앱이 이미 무료로 Hub에서 실행 중이어야 합니다! 그러나 더 많은 보안 정보와 업그레이드된 하드웨어를 이용하여 추가적으로 구성할 수 있습니다.
3. 보안 정보와 변수 설정하기
Space에서 작동하려면 일부 보안 키, 토큰 또는 변수가 필요할 수 있습니다. 자세한 내용은 문서를 참조하세요. Space에서 생성된 HF 토큰으로 이미지 데이터 세트를 Hub에 업로드하는 경우를 예로 들어봅시다.
>>> api.add_space_secret(repo_id=repo_id, key="HF_TOKEN", value="hf_api_***")
>>> api.add_space_variable(repo_id=repo_id, key="MODEL_REPO_ID", value="user/repo")
보안 정보와 변수는 삭제할 수도 있습니다:
>>> api.delete_space_secret(repo_id=repo_id, key="HF_TOKEN")
>>> api.delete_space_variable(repo_id=repo_id, key="MODEL_REPO_ID")
보너스: Space 생성 또는 복제 시 보안 정보와 변수 설정하기!
Space를 생성하거나 복제할 때 보안 정보와 변수를 설정할 수 있습니다:
>>> api.create_repo(
... repo_id=repo_id,
... repo_type="space",
... space_sdk="gradio",
... space_secrets=[{"key"="HF_TOKEN", "value"="hf_api_***"}, ...],
... space_variables=[{"key"="MODEL_REPO_ID", "value"="user/repo"}, ...],
... )
>>> api.duplicate_space(
... from_id=repo_id,
... secrets=[{"key"="HF_TOKEN", "value"="hf_api_***"}, ...],
... variables=[{"key"="MODEL_REPO_ID", "value"="user/repo"}, ...],
... )
4. 하드웨어 구성
기본적으로 Space는 무료로 CPU 환경에서 실행됩니다. GPU에서 실행하기 위해 하드웨어를 업그레이드 할 수도 있습니다. 하드웨어를 업그레이드하려면 결제 카드 또는 커뮤니티 그랜트가 필요합니다. 자세한 내용은 문서를 참조하세요.
# `SpaceHardware` enum 사용
>>> from huggingface_hub import SpaceHardware
>>> api.request_space_hardware(repo_id=repo_id, hardware=SpaceHardware.T4_MEDIUM)
# 또는 간단히 문자열 값 전달
>>> api.request_space_hardware(repo_id=repo_id, hardware="t4-medium")
Space가 서버에서 다시 로드되어야 하기 때문에 하드웨어 업데이트는 즉시 이루어지지 않습니다. Space가 어떤 하드웨어에서 실행되고 있는지 언제든지 확인하여 요청이 충족되었는지 확인할 수 있습니다.
>>> runtime = api.get_space_runtime(repo_id=repo_id)
>>> runtime.stage
"RUNNING_BUILDING"
>>> runtime.hardware
"cpu-basic"
>>> runtime.requested_hardware
"t4-medium"
이제 완전히 구성된 Space를 가지게 되었습니다. 사용이 끝난 후에는 Space를 “cpu-classic”으로 다운그레이드하는 것을 잊지 마세요.
보너스: Space를 생성하거나 복제할 때 하드웨어 요청하기!
Space가 구축되면 업그레이드된 하드웨어가 자동으로 할당됩니다.
>>> api.create_repo(
... repo_id=repo_id,
... repo_type="space",
... space_sdk="gradio"
... space_hardware="cpu-upgrade",
... space_storage="small",
... space_sleep_time="7200", # 2시간을 초로 환산
... )
>>> api.duplicate_space(
... from_id=repo_id,
... hardware="cpu-upgrade",
... storage="small",
... sleep_time="7200", # 2시간을 초로 환산
... )
5. Space 일시 중지 및 다시 시작
기본적으로 Space가 업그레이드된 하드웨어에서 실행 중이면 절대로 중단되지 않습니다. 그러나 요금이 부과되는 것을 피하려면 사용하지 않을 때 일시 중지하는 것이 좋습니다. 이는 pause_space()를 사용하여 가능합니다. 일시 중지된 Space는 Space 소유자가 UI를 통해 또는 restart_space()를 사용하여 API를 통해 다시 시작할 때까지 비활성화됩니다. 일시 중지된 모드에 대한 자세한 내용은 이 섹션을 참조하세요.
# 과금을 피하기 위해 Space를 일시 중지하세요
>>> api.pause_space(repo_id=repo_id)
# (...)
# 필요할 때 다시 시작하세요
>>> api.restart_space(repo_id=repo_id)
다른 방법은 Space에 대한 제한 시간을 설정하는 것입니다. Space가 제한 시간을 초과하여 비활성화되면 Space가 sleep 상태로 전환됩니다. Space를 방문한 방문자가 다시 시작시킬 수 있습니다. set_space_sleep_time()를 사용하여 제한 시간을 설정할 수 있습니다. Sleeping 모드에 대한 자세한 내용은 이 섹션을 참조하세요.
# 동작이 멈춘 후 1시간 후에 Space를 sleep 상태로 설정하세요
>>> api.set_space_sleep_time(repo_id=repo_id, sleep_time=3600)
참고: ‘cpu-basic’ 하드웨어를 사용하는 경우 사용자 정의 sleep 시간을 구성할 수 없습니다. Space가 48시간 동안 동작을 멈추면 자동으로 일시 중지됩니다.
보너스: 하드웨어를 요청하는 동안 sleep 시간 설정하기
업그레이드된 하드웨어가 Space에 자동으로 할당됩니다.
>>> api.request_space_hardware(repo_id=repo_id, hardware=SpaceHardware.T4_MEDIUM, sleep_time=3600)
보너스: Space를 생성하거나 복제할 때 sleep 시간 설정하기!
>>> api.create_repo(
... repo_id=repo_id,
... repo_type="space",
... space_sdk="gradio"
... space_hardware="t4-medium",
... space_sleep_time="3600",
... )
>>> api.duplicate_space(
... from_id=repo_id,
... hardware="t4-medium",
... sleep_time="3600",
... )
6. Space에 지속적으로 저장소 추가하기
Space를 다시 시작할 때 지속적으로 디스크 공간에 접근할 수 있는 원하는 저장소 계층을 선택할 수 있습니다. 이는 기존의 하드 드라이브와 같이 디스크에서 읽고 쓸 수 있음을 의미합니다. 자세한 내용은 문서를 참조하세요.
>>> from huggingface_hub import SpaceStorage
>>> api.request_space_storage(repo_id=repo_id, storage=SpaceStorage.LARGE)
또한 모든 데이터를 영구적으로 삭제하여 저장소를 삭제할 수 있습니다.
>>> api.delete_space_storage(repo_id=repo_id)
참고: 한 번 승인된 저장소의 저장소 계층을 낮출 수 없습니다. 그렇게 하려면, 먼저 저장소를 삭제한 다음 새로운 원하는 계층을 요청해야 합니다.
보너스: Space를 생성하거나 복제할 때 저장소 요청하기!
>>> api.create_repo(
... repo_id=repo_id,
... repo_type="space",
... space_sdk="gradio"
... space_storage="large",
... )
>>> api.duplicate_space(
... from_id=repo_id,
... storage="large",
... )
고급 기능: Space를 일시적으로 업그레이드하기!
Space는 다양한 사용 사례를 허용합니다. 때로는 특정 하드웨어에서 Space를 일시적으로 실행한 다음 무언가를 수행한 후 종료하고 싶을 수 있습니다. 이 섹션에서는 Space를 활용하여 필요할 때 모델을 세밀하게 조정하는 방법에 대해 탐색할 것입니다. 이는 특정 문제를 해결하는 한 가지 방법에 불과합니다. 이를 바탕으로 사용 사례에 맞게 조정해서 사용해야 합니다.
모델을 세밀하게 조정하기 위한 Space가 있다고 가정해 봅시다. 입력으로 모델 ID와 데이터 세트 ID를 받는 Gradio 앱입니다. 작업 흐름은 다음과 같습니다:
- (사용자에게 모델과 데이터 세트를 요청)
- Hub에서 모델을 로드합니다.
- Hub에서 데이터 세트를 로드합니다.
- 데이터 세트로 모델을 미세 조정합니다.
- 새 모델을 Hub에 업로드합니다.
단계 3.에서는 사용자 정의 하드웨어가 필요하지만 유료 GPU에서 Space를 항상 실행하고 싶지는 않을 것입니다. 이 때는 학습을 위해 하드웨어를 동적으로 요청한 다음 종료해야 합니다. 하드웨어를 요청하면 Space가 다시 시작되므로 앱은 현재 수행 중인 작업을 어떻게든 “기억”해야 합니다. 이를 수행하는 여러 가지 방법이 있습니다. 이 가이드에서는 “작업 스케줄러”로서 Dataset을 사용하는 하나의 해결책을 살펴보겠습니다.
앱 구조
다음은 구현된 앱의 모습입니다. 시작할 때 예약된 작업이 있는지 확인하고 있다면 적절한 하드웨어에서 실행합니다. 작업이 완료되면 하드웨어를 무료 요금제 CPU로 다시 설정하고 사용자에게 새 작업을 요청합니다.
# Space는 하드웨어를 요청하기 위해 토큰이 필요합니다: Secret으로 설정하세요!
HF_TOKEN = os.environ.get("HF_TOKEN")
# Space를 가진 repo_id
TRAINING_SPACE_ID = "Wauplin/dreambooth-training"
from huggingface_hub import HfApi, SpaceHardware
api = HfApi(token=HF_TOKEN)
# Space 시작 시 예약된 작업을 확인합니다. 예약된 작업이 있는 경우 모델을 미세 조정합니다. 그렇지 않은 경우,
# 새 작업을 요청할 수 있는 인터페이스를 표시합니다.
task = get_task()
if task is None:
# Gradio 앱 시작
def gradio_fn(task):
# 사용자 요청 시 작업 추가 및 하드웨어 요청
add_task(task)
api.request_space_hardware(repo_id=TRAINING_SPACE_ID, hardware=SpaceHardware.T4_MEDIUM)
gr.Interface(fn=gradio_fn, ...).launch()
else:
runtime = api.get_space_runtime(repo_id=TRAINING_SPACE_ID)
# GPU를 사용 중인지 확인합니다.
if runtime.hardware == SpaceHardware.T4_MEDIUM:
# 그렇다면, 기본 모델을 데이터 세트로 미세 조정합니다!
train_and_upload(task)
# 그런 다음, 작업을 "DONE"으로 표시합니다.
mark_as_done(task)
# 잊지 말아야 할 것: CPU 하드웨어로 다시 설정
api.request_space_hardware(repo_id=TRAINING_SPACE_ID, hardware=SpaceHardware.CPU_BASIC)
else:
api.request_space_hardware(repo_id=TRAINING_SPACE_ID, hardware=SpaceHardware.T4_MEDIUM)
작업 스케줄러
작업 스케줄링은 여러 가지 방법으로 수행할 수 있습니다. 여기에는 간단한 CSV 파일을 데이터 세트로 사용하여 작업 스케줄링을 하는 예시입니다.
# 'tasks.csv' 파일을 포함하는 데이터 세트의 Dataset ID.
# 여기서는 입력(기본 모델 및 데이터 세트)과 상태(PENDING 또는 DONE)가 포함된 'tasks.csv' 기본 예제가 주어집니다.
# multimodalart/sd-fine-tunable,Wauplin/concept-1,DONE
# multimodalart/sd-fine-tunable,Wauplin/concept-2,PENDING
TASK_DATASET_ID = "Wauplin/dreambooth-task-scheduler"
def _get_csv_file():
return hf_hub_download(repo_id=TASK_DATASET_ID, filename="tasks.csv", repo_type="dataset", token=HF_TOKEN)
def get_task():
with open(_get_csv_file()) as csv_file:
csv_reader = csv.reader(csv_file, delimiter=',')
for row in csv_reader:
if row[2] == "PENDING":
return row[0], row[1] # model_id, dataset_id
def add_task(task):
model_id, dataset_id = task
with open(_get_csv_file()) as csv_file:
with open(csv_file, "r") as f:
tasks = f.read()
api.upload_file(
repo_id=repo_id,
repo_type=repo_type,
path_in_repo="tasks.csv",
# 작업을 추가하기 위한 빠르고 더러운 방법
path_or_fileobj=(tasks + f"\n{model_id},{dataset_id},PENDING").encode()
)
def mark_as_done(task):
model_id, dataset_id = task
with open(_get_csv_file()) as csv_file:
with open(csv_file, "r") as f:
tasks = f.read()
api.upload_file(
repo_id=repo_id,
repo_type=repo_type,
path_in_repo="tasks.csv",
# 작업을 DONE으로 설정하는 빠르고 더러운 방법
path_or_fileobj=tasks.replace(
f"{model_id},{dataset_id},PENDING",
f"{model_id},{dataset_id},DONE"
).encode()
)