DHEIVER
/

ClinicalBERT

@@ -6,33 +6,32 @@ tags:
 <!-- Provide a quick summary of what the model is/does. -->
-This model card describes the ClinicalBERT model, which was trained on a large multicenter dataset with a large corpus of 1.2B words of diverse diseases we constructed.
-We then utilized a large-scale corpus of EHRs from over 3 million patient records to fine tune the base language model.
-## Pretraining Data
-The ClinicalBERT model was trained on a large multicenter dataset with a large corpus of 1.2B words of diverse diseases we constructed.
-<!-- For more details, see here.  -->
-## Model Pretraining
-### Pretraining Procedures
-The ClinicalBERT was initialized from BERT. Then the training followed the principle of masked language model, in which given a piece of text, we randomly replace some tokens by MASKs,
-special tokens for masking, and then require the model to predict the original tokens via contextual text.
-### Pretraining Hyperparameters
-We used a batch size of 32, a maximum sequence length of 256, and a learning rate of 5e-5 for pre-training our models.
-## How to use the model
-Load the model via the transformers library:
 ```python
 from transformers import AutoTokenizer, AutoModel
 tokenizer = AutoTokenizer.from_pretrained("medicalai/ClinicalBERT")
 model = AutoModel.from_pretrained("medicalai/ClinicalBERT")
 ```
-## Citation
-Please cite this article:  Wang, G., Liu, X., Ying, Z. et al. Optimized glycemic control of type 2 diabetes with reinforcement learning: a proof-of-concept trial. Nat Med (2023). https://doi.org/10.1038/s41591-023-02552-9

 <!-- Provide a quick summary of what the model is/does. -->
+Este cartão descreve o modelo ClinicalBERT, que foi treinado em um grande conjunto de dados multicêntrico com um corpus grande de 1,2 bilhão de palavras de diversas doenças que construímos. Em seguida, utilizamos um corpus em grande escala de prontuários eletrônicos de mais de 3 milhões de registros de pacientes para ajustar finamente o modelo de linguagem base.
+## Dados de Pré-Treinamento
+O modelo ClinicalBERT foi treinado em um grande conjunto de dados multicêntrico com um corpus grande de 1,2 bilhão de palavras de diversas doenças que construímos.
+<!-- Para mais detalhes, consulte aqui.  -->
+## Pré-Treinamento do Modelo
+### Procedimentos de Pré-Treinamento
+O ClinicalBERT foi inicializado a partir do BERT. Em seguida, o treinamento seguiu o princípio do modelo de linguagem mascarada, no qual, dada uma peça de texto, substituímos aleatoriamente alguns tokens por MASKs,
+tokens especiais para mascaramento, e depois exigimos que o modelo preveja os tokens originais por meio de texto contextual.
+### Hiperparâmetros de Pré-Treinamento
+Utilizamos um tamanho de lote de 32, um comprimento máximo de sequência de 256 e uma taxa de aprendizado de 5e-5 para o pré-treinamento de nossos modelos.
+## Como usar o modelo
+Carregue o modelo via biblioteca transformers:
 ```python
 from transformers import AutoTokenizer, AutoModel
 tokenizer = AutoTokenizer.from_pretrained("medicalai/ClinicalBERT")
 model = AutoModel.from_pretrained("medicalai/ClinicalBERT")
 ```
+## Citação
+Por favor, cite este artigo:  Wang, G., Liu, X., Ying, Z. et al. Controle glicêmico otimizado do diabetes tipo 2 com aprendizado por reforço: um ensaio de prova de conceito. Nat Med (2023). https://doi.org/10.1038/s41591-023-02552-9