lbergen
/

Synapse-Localization

Model card Files Files and versions

xet

Community

lbergen commited on May 15, 2025

Commit

dc4fc25

verified ·

1 Parent(s): ffe1872

Upload 2 files

Browse files

Files changed (2) hide show

Pretraining/config_tree.txt +157 -0
Pretraining/last.ckpt +3 -0

Pretraining/config_tree.txt ADDED Viewed

	@@ -0,0 +1,157 @@

+CONFIG
+├── train
+│   └── seed: 2222
+│       interval: step
+│       monitor: test/loss
+│       mode: min
+│       ema: 0.0
+│       test: false
+│       debug: false
+│       ignore_warnings: false
+│       state:
+│         mode: null
+│         n_context: 0
+│         n_context_eval: 0
+│       ckpt: null
+│       disable_dataset: false
+│       validate_at_start: false
+│       pretrained_model_path: null
+│       pretrained_model_strict_load: true
+│       pretrained_model_state_hook:
+│         _name_: null
+│       post_init_hook:
+│         _name_: null
+│       layer_decay:
+│         _name_: null
+│         decay: 0.7
+│       gpu_mem: 82
+│       global_batch_size: 144
+│
+├── tolerance
+│   └── logdir: ./resume
+│       id: null
+│
+├── wandb
+│   └── project: rna-llm
+│       group: ''
+│       job_type: training
+│       mode: online
+│       name: null
+│       save_dir: .
+│       id: null
+│
+├── trainer
+│   └── _target_: pytorch_lightning.Trainer
+│       devices: 6
+│       accelerator: gpu
+│       accumulate_grad_batches: 6
+│       max_epochs: 2
+│       gradient_clip_val: 1.0
+│       log_every_n_steps: 10
+│       limit_train_batches: 1.0
+│       limit_val_batches: 1.0
+│       num_nodes: 1
+│       precision: bf16
+│
+├── loader
+│   └── batch_size: 50
+│       num_workers: 4
+│       pin_memory: true
+│       drop_last: true
+│
+├── dataset
+│   └── _name_: mrna
+│       fasta_directory: /workspace/data/mrna/
+│       dataset_name: mrna
+│       tokenizer_name: char
+│       cache_dir: null
+│       max_length: 8192
+│       add_eos: true
+│       batch_size: 4
+│       batch_size_eval: 8
+│       num_workers: 12
+│       shuffle: true
+│       pin_memory: true
+│       max_length_val: 8192
+│       max_length_test: 8192
+│       pad_max_length: null
+│       rc_aug: false
+│       use_fixed_len_val: false
+│
+├── optimizer
+│   └── _name_: adamw
+│       lr: 0.0006
+│       weight_decay: 0.1
+│       betas:
+│       - 0.9
+│       - 0.999
+│
+├── scheduler
+│   └── _name_: cosine_warmup_timm
+│       t_in_epochs: false
+│       t_initial: 24000
+│       lr_min: 5.9999999999999995e-05
+│       warmup_lr_init: 1.0e-06
+│       warmup_t: 2000
+│
+├── callbacks
+│   └── learning_rate_monitor:
+│         logging_interval: step
+│       timer:
+│         step: true
+│         inter_step: false
+│         epoch: true
+│         val: true
+│       params:
+│         total: true
+│         trainable: true
+│         fixed: true
+│       model_checkpoint:
+│         monitor: test/loss
+│         mode: min
+│         save_top_k: 1
+│         save_last: true
+│         dirpath: checkpoints/
+│         filename: test/loss
+│         auto_insert_metric_name: false
+│         verbose: true
+│
+├── task
+│   └── _name_: lm
+│       loss:
+│         _name_: cross_entropy
+│         ignore_index: 4
+│       torchmetrics:
+│       - perplexity
+│       - num_tokens
+│
+├── encoder
+│   └── None
+├── decoder
+│   └── None
+���── model
+    └── _name_: lm
+        d_model: 1024
+        n_layer: 24
+        d_inner: 4096
+        vocab_size: 12
+        resid_dropout: 0.0
+        embed_dropout: 0.1
+        fused_mlp: false
+        fused_dropout_add_ln: false
+        checkpoint_mixer: false
+        checkpoint_mlp: false
+        residual_in_fp32: true
+        pad_vocab_size_multiple: 8
+        layer:
+          _name_: hyena
+          emb_dim: 5
+          filter_order: 64
+          local_order: 3
+          l_max: 8194
+          modulate: true
+          w: 10
+          lr: 0.0006
+          wd: 0.0
+          lr_pos_emb: 0.0

Pretraining/last.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5da354655edbc656a5952c7b7f7fcb3359ab28b1103e6f13191fd3139b078559
+size 3658749089