4eJIoBek
/

Shap-E

Model card Files Files and versions Community

4eJIoBek commited on May 6, 2023

Commit

2424ea6

1 Parent(s): 5da6e63

Upload 8 files

Browse files

Files changed (8) hide show

ViT-L-14.pt +3 -0
diffusion_config.yaml +3 -0
image_cond.pt +3 -0
image_cond_config.yaml +13 -0
text_cond.pt +3 -0
text_cond_config.yaml +14 -0
transmitter.pt +3 -0
transmitter_config.yaml +80 -0

ViT-L-14.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b8cca3fd41ae0c99ba7e8951adf17d267cdb84cd88be6f7c2e0eca1737a03836
+size 932768134

diffusion_config.yaml ADDED Viewed

	@@ -0,0 +1,3 @@

+mean_type: x_start
+schedule: exp
+timesteps: 1024

image_cond.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cb8072c64bbbcf6910488814d212227de5db291780d4ea99c6152f9346cf12aa
+size 1263925407

image_cond_config.yaml ADDED Viewed

	@@ -0,0 +1,13 @@

+d_latent: 1048576
+inner:
+  cond_drop_prob: 0.1
+  heads: 8
+  init_scale: 0.25
+  layers: 24
+  name: CLIPImageGridPointDiffusionTransformer
+  pos_emb_init_scale: 0.05
+  time_token_cond: true
+  use_pos_emb: true
+  width: 1024
+latent_ctx: 1024
+name: SplitVectorDiffusion

text_cond.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e6b4fa599a7b3c3b16c222d5f5fe56f9db9289ff0b6575fbe5c11bc97106aad4
+size 1262868003

text_cond_config.yaml ADDED Viewed

	@@ -0,0 +1,14 @@

+d_latent: 1048576
+inner:
+  cond_drop_prob: 0.1
+  heads: 16
+  init_scale: 0.25
+  layers: 24
+  name: CLIPImagePointDiffusionTransformer
+  pos_emb_init_scale: 0.05
+  time_token_cond: true
+  token_cond: true
+  use_pos_emb: true
+  width: 1024
+latent_ctx: 1024
+name: SplitVectorDiffusion

transmitter.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:af02a0b85a8abdfb3919584b63c540ba175f6ad4790f574a7fef4617e5acdc3b
+size 1776048343

transmitter_config.yaml ADDED Viewed

	@@ -0,0 +1,80 @@

+encoder:
+  cross_attention_dataset: pcl_and_multiview_pcl
+  d_latent: 1024
+  data_ctx: 1024
+  fps_method: first
+  heads: 8
+  init_scale: 0.25
+  inner_batch_size:
+  - 16384
+  - 20
+  input_channels: 6
+  latent_bottleneck:
+    diffusion:
+      schedule: inv_parabola
+      schedule_args:
+        power: 5.0
+      timesteps: 1024
+    diffusion_prob: 0.1
+    name: clamp_diffusion_noise
+  layers: 12
+  max_depth: 9.0
+  max_unrolls: 1
+  min_unrolls: 1
+  name: PointCloudPerceiverChannelsEncoder
+  params_proj:
+    init_scale: 1.0
+    learned_scale: 0.0625
+    name: channels
+    use_ln: true
+  patch_size: 8
+  pointconv_hidden:
+  - 1024
+  - 1024
+  pointconv_padding_mode: circular
+  pointconv_patch_size: 8
+  pointconv_samples: 64
+  pointconv_stride: 4
+  pos_emb: nerf
+  use_depth: true
+  use_pointconv: true
+  width: 1024
+name: Transmitter
+renderer:
+  grid_size: 128
+  n_coarse_samples: 64
+  n_fine_samples: 128
+  name: NeRSTFRenderer
+  nerstf:
+    activation: swish
+    d_hidden: 256
+    density_activation: relu
+    init_scale: 0.25
+    initial_density_bias: 0.1
+    insert_direction_at: 4
+    meta_bias: false
+    meta_parameters: true
+    n_hidden_layers: 6
+    n_meta_layers: 4
+    name: MLPNeRSTFModel
+    posenc_version: nerf
+    separate_coarse_channels: true
+    separate_nerf_channels: true
+    trainable_meta: false
+  separate_shared_samples: true
+  void:
+    background:
+    - 0
+    - 0
+    - 0
+    name: VoidNeRFModel
+  volume:
+    bbox_max:
+    - 1.0
+    - 1.0
+    - 1.0
+    bbox_min:
+    - -1.0
+    - -1.0
+    - -1.0
+    name: BoundingBoxVolume