genbio-ai
/

AIDO.Protein-16B-ssp_q3

Caleb Ellington commited on Dec 5, 2024

Commit

beaed13

1 Parent(s): 49d76bc

update with major refactor

Files changed (2) hide show

README.md CHANGED Viewed

@@ -20,12 +20,12 @@ snapshot_download(repo_id=model_name, local_dir=genbio_models_path)
 ### Load model for inference
 ```python
 import torch
-from genbio_finetune.tasks import TokenClassification
 ckpt_path = genbio_models_path.joinpath('model.ckpt')
 model = TokenClassification.load_from_checkpoint(ckpt_path, strict_loading=False).eval()
-collated_batch = model.collate({"sequences": ["ACGT", "AGCT"]})
 logits = model(collated_batch)
 print(logits)
 print(torch.argmax(logits, dim=-1))

 ### Load model for inference
 ```python
 import torch
+from modelgenerator.tasks import TokenClassification
 ckpt_path = genbio_models_path.joinpath('model.ckpt')
 model = TokenClassification.load_from_checkpoint(ckpt_path, strict_loading=False).eval()
+collated_batch = model.transform({"sequences": ["ACGT", "AGCT"]})
 logits = model(collated_batch)
 print(logits)
 print(torch.argmax(logits, dim=-1))

config.yaml CHANGED Viewed

@@ -77,7 +77,7 @@ trainer:
       log_weight_decay: false
   - class_path: lightning.pytorch.callbacks.ModelCheckpoint
     init_args:
-      dirpath: genbio_finetune/logs/xtrimo_benchmark_gbft_reproduction/ssp_proteinmoe_16B
       filename: best_val:{epoch}-{val_accuracy:.3f}
       monitor: val_accuracy
       verbose: false
@@ -138,10 +138,10 @@ trainer:
   reload_dataloaders_every_n_epochs: 0
   default_root_dir: null
 model:
-  class_path: genbio_finetune.tasks.TokenClassification
   init_args:
     adapter:
-      class_path: genbio_finetune.models.MLPAdapter
       init_args:
         hidden_sizes:
         - 128
@@ -149,7 +149,7 @@ model:
         dropout: 0.1
         dropout_in_middle: true
     backbone:
-      class_path: genbio_finetune.models.proteinfm
       init_args:
         from_scratch: false
         max_length: 512
@@ -187,7 +187,7 @@ model:
         differentiable: false
         fused: null
     lr_scheduler:
-      class_path: genbio_finetune.lr_schedulers.CosineWithWarmup
       init_args:
         warmup_ratio: 0.05
         num_warmup_steps: null
@@ -197,7 +197,7 @@ model:
     strict_loading: true
     reset_optimizer_states: false
 data:
-  class_path: genbio_finetune.data.SspQ3
   init_args:
     path: biomap-research/ssp_q3
     batch_size: 1

       log_weight_decay: false
   - class_path: lightning.pytorch.callbacks.ModelCheckpoint
     init_args:
+      dirpath: modelgenerator/logs/xtrimo_benchmark_gbft_reproduction/ssp_proteinmoe_16B
       filename: best_val:{epoch}-{val_accuracy:.3f}
       monitor: val_accuracy
       verbose: false
   reload_dataloaders_every_n_epochs: 0
   default_root_dir: null
 model:
+  class_path: modelgenerator.tasks.TokenClassification
   init_args:
     adapter:
+      class_path: modelgenerator.adapters.MLPAdapter
       init_args:
         hidden_sizes:
         - 128
         dropout: 0.1
         dropout_in_middle: true
     backbone:
+      class_path: modelgenerator.backbones.proteinfm
       init_args:
         from_scratch: false
         max_length: 512
         differentiable: false
         fused: null
     lr_scheduler:
+      class_path: modelgenerator.lr_schedulers.CosineWithWarmup
       init_args:
         warmup_ratio: 0.05
         num_warmup_steps: null
     strict_loading: true
     reset_optimizer_states: false
 data:
+  class_path: modelgenerator.data.SspQ3
   init_args:
     path: biomap-research/ssp_q3
     batch_size: 1