flax-community
/

gpt2-medium-indonesian

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

cahya commited on Aug 31, 2021

Commit

e5e9f73

•

1 Parent(s): 8696911

added run finetuning

Files changed (1) hide show

run_finetuning.sh +29 -0

run_finetuning.sh ADDED Viewed

	@@ -0,0 +1,29 @@

+export MODEL_DIR=`pwd`
+export WANDB_ENTITY="cahya"
+export WANDB_PROJECT="gpt2-indonesian"
+export WANDB_LOG_MODEL="true"
+./run_clm_flax.py \
+    --model_name_or_path="./flax_model.msgpack" \
+    --output_dir="${MODEL_DIR}/finetuning2" \
+    --model_type="gpt2" \
+    --config_name="${MODEL_DIR}" \
+    --tokenizer_name="${MODEL_DIR}" \
+    --dataset_name="./text_collection" \
+    --dataset_config_name="text_collection" \
+    --dataset_data_dir="/dataset/fiction/story_all" \
+    --do_train --do_eval \
+    --block_size="512" \
+    --per_device_train_batch_size="8" \
+    --per_device_eval_batch_size="8" \
+    --learning_rate="0.0000001" --warmup_steps="1000" \
+    --adam_beta1="0.9" --adam_beta2="0.98" --weight_decay="0.01" \
+    --overwrite_output_dir \
+    --num_train_epochs="20" \
+    --dataloader_num_workers="64" \
+    --preprocessing_num_workers="64" \
+    --logging_steps="1000" \
+    --save_steps="1000" \
+    --eval_steps="1000" \
+    --validation_split_percentage="10" \
+    --push_to_hub="false"