sfreirman
/

LLaMa_1_large

Model card Files Files and versions Community

LLaMa_1_large / README.md

sfreirman's picture

Update README.md

280c54b verified 5 months ago

|

history blame contribute delete

1.26 kB

	---
	license: apache-2.0
	language:
	- pt
	- en
	tags:
	- code
	- kj
	---

	# Model Card for Model ID

	<!-- Provide a quick summary of what the model is/does. -->

	This modelcard aims to be a base template for new models. It has been generated using [this raw template](https://github.com/huggingface/huggingface_hub/blob/main/src/huggingface_hub/templates/modelcard_template.md?plain=1).

	## Model Details

	### Model Description

	-- Esse trabalho consiste em desenvolver um modelo de linguagem grande (LLM) com 2.3 milhões de parâmetros usando a arquitetura LLaMA 1,
	-- implementado em um notebook do Google Collaboratory. Os alunos irão construir um LLM desde o pré-processamento dos dados até a avaliação
	-- do desempenho do modelo. O projeto envolverá as etapas principais de preparação de dados, configuração do modelo, treinamento e avaliação.


	- Developed by: Amanda Freire
	- Funded by [optional]: Amanda Freire
	- Shared by [optional]: Amanda Freire
	- Model type: LLaMa-1
	- Language(s) (NLP): [More Information Needed]
	- License: Apache

	## Uses

	-- modelo GPT-2 na coleção TinyShakespeare.
	-- Implementação dos componentes principais da arquitetura LLaMA 1 [4]:
	-- RMSNorm
	-- SwiGLU
	-- Rotary Embeddings