{"device": "cuda", "per_gpu_train_batch_size": 4, "per_gpu_unlabeled_batch_size": 64, "n_gpu": 1, "num_train_epochs": 3.0, "max_steps": -1, "gradient_accumulation_steps": 1, "weight_decay": 0.01, "learning_rate": 1e-05, "adam_epsilon": 1e-08, "warmup_steps": 0, "max_grad_norm": 1.0, "lm_training": false, "use_logits": true, "alpha": 0.9999, "temperature": 2}