martin-gorner
/

ari_tiny_test_llama

Model card Files Files and versions Community

martin-gorner HF staff commited on Nov 5

Commit

9ebf2a8

•

1 Parent(s): fa2eb2d

Upload 8 files

Browse files

Files changed (8) hide show

assets/tokenizer/merges.txt +0 -0
assets/tokenizer/vocabulary.json +0 -0
config.json +19 -0
metadata.json +6 -0
model.weights.h5 +3 -0
preprocessor.json +48 -0
task.json +75 -0
tokenizer.json +27 -0

assets/tokenizer/merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

assets/tokenizer/vocabulary.json ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json ADDED Viewed

	@@ -0,0 +1,19 @@

+{
+    "module": "keras_hub.src.models.llama3.llama3_backbone",
+    "class_name": "Llama3Backbone",
+    "config": {
+        "name": "llama3_backbone",
+        "trainable": true,
+        "vocabulary_size": 128256,
+        "num_layers": 1,
+        "num_query_heads": 32,
+        "hidden_dim": 64,
+        "intermediate_dim": 64,
+        "rope_max_wavelength": 10000,
+        "rope_scaling_factor": 1.0,
+        "num_key_value_heads": 1,
+        "layer_norm_epsilon": 1e-06,
+        "dropout": 0
+    },
+    "registered_name": "keras_hub>Llama3Backbone"
+}

metadata.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "keras_version": "3.6.0",
+    "keras_hub_version": "0.17.0.dev0",
+    "parameter_count": 16437696,
+    "date_saved": "2024-11-04@16:23:39"
+}

model.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:02545d0637782c778f6817e5b91d731756b5adf44b37ba78b840f9c3ae184332
+size 65800256

preprocessor.json ADDED Viewed

	@@ -0,0 +1,48 @@

+{
+    "module": "keras_hub.src.models.llama3.llama3_causal_lm_preprocessor",
+    "class_name": "Llama3CausalLMPreprocessor",
+    "config": {
+        "name": "llama3_causal_lm_preprocessor",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "float32"
+            },
+            "registered_name": null
+        },
+        "tokenizer": {
+            "module": "keras_hub.src.models.llama3.llama3_tokenizer",
+            "class_name": "Llama3Tokenizer",
+            "config": {
+                "name": "llama3_tokenizer",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "int32"
+                    },
+                    "registered_name": null
+                },
+                "config_file": "tokenizer.json",
+                "sequence_length": null,
+                "add_prefix_space": false,
+                "unsplittable_tokens": [
+                    "<|end_header_id|>",
+                    "<|end_of_text|>",
+                    "<|eot_id|>",
+                    "<|start_header_id|>",
+                    "<|begin_of_text|>"
+                ]
+            },
+            "registered_name": "keras_hub>Llama3Tokenizer"
+        },
+        "config_file": "preprocessor.json",
+        "sequence_length": 1024,
+        "add_start_token": true,
+        "add_end_token": true
+    },
+    "registered_name": "keras_hub>Llama3CausalLMPreprocessor"
+}

task.json ADDED Viewed

	@@ -0,0 +1,75 @@

+{
+    "module": "keras_hub.src.models.llama3.llama3_causal_lm",
+    "class_name": "Llama3CausalLM",
+    "config": {
+        "backbone": {
+            "module": "keras_hub.src.models.llama3.llama3_backbone",
+            "class_name": "Llama3Backbone",
+            "config": {
+                "name": "llama3_backbone",
+                "trainable": true,
+                "vocabulary_size": 128256,
+                "num_layers": 1,
+                "num_query_heads": 32,
+                "hidden_dim": 64,
+                "intermediate_dim": 64,
+                "rope_max_wavelength": 10000,
+                "rope_scaling_factor": 1.0,
+                "num_key_value_heads": 1,
+                "layer_norm_epsilon": 1e-06,
+                "dropout": 0
+            },
+            "registered_name": "keras_hub>Llama3Backbone"
+        },
+        "preprocessor": {
+            "module": "keras_hub.src.models.llama3.llama3_causal_lm_preprocessor",
+            "class_name": "Llama3CausalLMPreprocessor",
+            "config": {
+                "name": "llama3_causal_lm_preprocessor",
+                "trainable": true,
+                "dtype": {
+                    "module": "keras",
+                    "class_name": "DTypePolicy",
+                    "config": {
+                        "name": "float32"
+                    },
+                    "registered_name": null
+                },
+                "tokenizer": {
+                    "module": "keras_hub.src.models.llama3.llama3_tokenizer",
+                    "class_name": "Llama3Tokenizer",
+                    "config": {
+                        "name": "llama3_tokenizer",
+                        "trainable": true,
+                        "dtype": {
+                            "module": "keras",
+                            "class_name": "DTypePolicy",
+                            "config": {
+                                "name": "int32"
+                            },
+                            "registered_name": null
+                        },
+                        "config_file": "tokenizer.json",
+                        "sequence_length": null,
+                        "add_prefix_space": false,
+                        "unsplittable_tokens": [
+                            "<|end_header_id|>",
+                            "<|end_of_text|>",
+                            "<|eot_id|>",
+                            "<|start_header_id|>",
+                            "<|begin_of_text|>"
+                        ]
+                    },
+                    "registered_name": "keras_hub>Llama3Tokenizer"
+                },
+                "config_file": "preprocessor.json",
+                "sequence_length": 1024,
+                "add_start_token": true,
+                "add_end_token": true
+            },
+            "registered_name": "keras_hub>Llama3CausalLMPreprocessor"
+        },
+        "name": "llama3_causal_lm"
+    },
+    "registered_name": "keras_hub>Llama3CausalLM"
+}

tokenizer.json ADDED Viewed

	@@ -0,0 +1,27 @@

+{
+    "module": "keras_hub.src.models.llama3.llama3_tokenizer",
+    "class_name": "Llama3Tokenizer",
+    "config": {
+        "name": "llama3_tokenizer",
+        "trainable": true,
+        "dtype": {
+            "module": "keras",
+            "class_name": "DTypePolicy",
+            "config": {
+                "name": "int32"
+            },
+            "registered_name": null
+        },
+        "config_file": "tokenizer.json",
+        "sequence_length": null,
+        "add_prefix_space": false,
+        "unsplittable_tokens": [
+            "<|end_header_id|>",
+            "<|end_of_text|>",
+            "<|eot_id|>",
+            "<|start_header_id|>",
+            "<|begin_of_text|>"
+        ]
+    },
+    "registered_name": "keras_hub>Llama3Tokenizer"
+}