josedossantos's picture
Add new SentenceTransformer model.
d55147b verified
metadata
language: []
library_name: sentence-transformers
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - dataset_size:10K<n<100K
  - loss:ContrastiveLoss
base_model: neuralmind/bert-large-portuguese-cased
widget:
  - source_sentence: ' O projeto de lei visa alterar o art. 1.788 do Código Civil para normatizar a sucessão de bens e contas digitais do autor da herança de qualidade patrimonial. O projeto pretende tratar do tema relevante e atual de herança digital, que tem sido objeto de diversos casos no Judiciário, e estabelecer medidas para a pacificação de conflitos sociais.'
    sentences:
      - ' O projeto de lei visa alterar o art. 1.788 do Código Civil, estabelecendo que os herdeiros terão direito acesso e controle sobre contas digitais e arquivos de serviços online de falecidos, sem precisar de autorização judicial. A medida busca regularizar e uniformizar o tratamento das sucessões bens contas digitais, evitando conflitos sociais e garantindo o direito dos herdeiros.'
      - ' O projeto de lei visa alterar a redação do Art. 43 da Lei nº 8.078/90, permitindo a inclusão de cadastros negativos de consumidores em bancos de dados, contestando débitos líquidos certos sendo contestados judicialmente. Essa alteração busca adequar as disposições legais às novas necessidades do mercado e evitar a exclusão de consumidores dos bancos de dados. Ao permitir a inclusão de cadastros negativos, o projeto busca evitar a pressão de fornecedores para que os consumidores reconheçam débitos que não são verdadeiros.'
      - ' O projeto de lei proíbe as centrais de telemarketing de realizar chamadas automatizadas sem a presença de um operador natural. As chamadas devem ter a opção de contato com um atendente natural no primeiro menu eletrônico. A fiscalização será realizada pelo Sistema Nacional de Defesa do Consumidor do Ministério da Justiça. A aplicação da multa de até R$ 2.000.000,00 pode ser aplicada em caso de descumprimento. O projeto visa proteger os cidadãos brasileiros de chamadas agressivas e invasivas.'
  - source_sentence: ' O projeto de lei proíbe a realização de chamadas telefônicas anônimas, obrigando a identificação do remetente e do destinatário. A justificativa é a necessidade de combater crimes e violações de direitos garantidos, que ocorrem por meio do uso inadequado da telefonia. A proibição será aplicada a partir da data de publicação da lei.'
    sentences:
      - ' O projeto de lei visa obrigar as operadoras de telefonia fixa e celular a informarem o código de acesso do usuário chamador em ligações telefônicas, sem ônus para o usuário receptor. A medida busca reforçar a segurança pública e facilitar as investigações e a prisão de criminosos que se escondem atrás da situação anônima da chamada não identificada. O projeto foi apresentado pelo deputado federal Alberto Fraga e justifica-se com a necessidade de combater a criminalidade que utiliza as telecomunicações para perpetrar crimes.'
      - ' O projeto de lei nº 2007 do sr deputado Deley estabelece concessão de visto temporário para estrangeiros que vierem trabalhar temporariamente em eventos esportivos internacionais no Brasil, como a Copa do Mundo de 2014 e as Olimpíadas. A lei também estabelece facilidades para a concessão de visto e registro de entrada no país para essas pessoas. A justificativa para o projeto é a importância dos eventos esportivos brasileiros e a necessidade de garantir a presença de estrangeiros para a realização desses eventos.'
      - ' O projeto de lei visa alterar a redação do Art. 43 da Lei nº 8.078/90, permitindo a inclusão de cadastros negativos de consumidores em bancos de dados, contestando débitos líquidos certos sendo contestados judicialmente. Essa alteração busca adequar as disposições legais às novas necessidades do mercado e evitar a exclusão de consumidores dos bancos de dados. Ao permitir a inclusão de cadastros negativos, o projeto busca evitar a pressão de fornecedores para que os consumidores reconheçam débitos que não são verdadeiros.'
  - source_sentence: ' O projeto de lei visa permitir que os contribuintes deduzam das receitas tributáveis as despesas realizadas com matrículas e mensalidades de cursos de idiomas estrangeiros, com o objetivo de incentivar a educação e o desenvolvimento profissional. A proposta foi apresentada pelo deputado Fernando Coruja e está sendo discutida no Congresso Nacional.'
    sentences:
      - ' O projeto de lei nº 2016, de 2016, proposto pelo deputado Aureo, permite a dedução de pagamentos relativos a despesas com cursos de idiomas estrangeiros para apuração do imposto sobre a renda das pessoas físicas. A justificativa para a proposta é que a rede pública de ensino não é capaz de dotar os brasileiros das habilidades necessárias para dominar um idioma estrangeiro, e que a dedução deveria incentivar o custeio dos cursos realizados em escolas privadas. O projeto prevê a dedução de despesas com cursos de idiomas estrangeiros até o limite anual individual de NR$ 2.000,00.'
      - ' O presente Projeto de Lei visa reformular o Ensino Médio, com o objetivo de torná-lo mais atraente e de qualidade, oferecendo opções formativas para os alunos, com ênfase em línguas, matemáticas, ciências e humanidades, além de habilidades técnicas e sociais. Além disso, estabelece a jornada escolar em tempo integral, permitindo a ampliação das vagas de ensino médio e a redução da taxa de abandono. O projeto também prevê a criação de programas de formação para os professores e a revisão dos conteúdos curriculares.'
      - ' O projeto de lei dispõe que as operadoras telefonia móvel devem manter um cadastro atualizado com informações dos proprietários dos aparelhos celulares, e que os usuários devem fornecer cópias simples das informações de identificação para a operadora. Além disso, o projeto estabelece penalidades para a utilização indevida dos aparelhos celulares, e prevê a bloqueio do IMEI do aparelho em caso de perda, furto ou roubo. O objetivo do projeto é proteger o patrimônio dos cidadãos e garantir a segurança pública.'
  - source_sentence: ' O projeto de lei do deputado Washington Reis dispõe isenção ao pagamento de pedágio para motocicletas similares em rodovias federais. A justificativa para essa proposição é que esses veículos causam menos danos às estradas e ao meio ambiente, além de representarem uma economia de gasolina e uma diminuição no volume do tráfego.'
    sentences:
      - ' O projeto de lei proposto por Deputado Gutemberg Reis dispõe sobre a isenção de pagamento de pedágio para motocicletas e similares em rodovias federais. A justificativa para essa proposta é que esses veículos, devido às suas características, não causam danos às estradas e ao meio-ambiente, e que eles representam economia de gasolina, diminuição do volume de tráfego e diminuição dos índices de poluição. O projeto de lei busca contemplar esses veículos com uma isenção de pagamento de pedágio em rodovias federais.'
      - ' O projeto de lei visa alterar o Código Eleitoral para instituir o sistema majoritário uninominal nas eleições para vereadores em municípios com mais de 200.000 eleitores, permitindo que os eleitores tenham certeza de que o seu voto tem efeito direto na escolha do vereador e reduzindo custos de financiamento das campanhas. Além disso, a proposta prevê a extinção do horário eleitoral gratuito no rádio e na televisão para os candidatos a vereador, considerando que o sistema distrital será mais eficaz e menos dispendioso.'
      - ' O projeto de lei proíbe a realização de ligações telefônicas não identificáveis, com o objetivo de inibir a proliferação de ligações confidenciais com fins de telemarketing e cobrança, e também para reduzir os índices de criminalidade no país. O projeto mantém o dispositivo da Lei Geral de Telecomunicações que assegura ao usuário o direito à não divulgação do seu número telefônico, mas apenas em listas de assinantes. O projeto estabelece um prazo de noventa dias para que a norma proposta passe a vigorar, permitindo que as operadoras adaptem suas redes para adequação ao disposto na proposição.'
  - source_sentence: ' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de 19 de setembro de 1990, para permitir o atendimento de serviços saúde para os soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros que lutaram na guerra.'
    sentences:
      - ' O projeto de lei apresentado pelo deputado Mauro Nazif em 2007 visa sanar uma falha legislativa na Lei nº 7.986/1989, que omite a gratificação natalina para beneficiários de pensões vitalícias. O projeto propõe a alteração da Lei nº 7.986/1989 para garantir o recebimento da gratificação natalina para os beneficiários de pensões vitalícias, que atualmente não têm direito a essa benefício. Além disso, o projeto também busca regular a percepção da gratificação natalina para os aposentados e anistiaados.'
      - ' A proposta de emenda constitucional visa criar as polícias penais federal, estaduais e distrital, e estabelecer as suas atribuições e subordinação. O quadro de servidores das polícias penais será preenchido por meio de concurso público ou da transformação dos cargos isolados ou dos cargos de carreira dos atuais agentes penitenciários ou equivalentes. A emenda também estabelece a subordinação das polícias militares e dos corpos de bombeiros militares aos Governadores dos Estados, do Distrito Federal e dos Territórios.'
      - ' A proposta de lei visa acrescentar as metas brasileiras de redução de emissões para os períodos pós-2020, e dá outras providências. O Congresso Nacional decreta que a Política Nacional sobre Mudança do Clima será instituída, e as metas brasileiras de redução de emissões propostas para os períodos de 2020 a 2025 e de 2025 a 2030. Além disso, a Lei acrescenta o art. 12-A, que estabelece que as propostas brasileiras sobre prevenção, mitigação e adaptação às mudanças do clima devem ser precedidas de consulta pública e divulgadas em todo o território nacional.'
pipeline_tag: sentence-similarity

SentenceTransformer based on neuralmind/bert-large-portuguese-cased

This is a sentence-transformers model finetuned from neuralmind/bert-large-portuguese-cased. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: neuralmind/bert-large-portuguese-cased
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 1024 tokens
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("josedossantos/urf-summary-bertimbau")
# Run inference
sentences = [
    ' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de 19 de setembro de 1990, para permitir o atendimento de serviços saúde para os soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros que lutaram na guerra.',
    ' O projeto de lei apresentado pelo deputado Mauro Nazif em 2007 visa sanar uma falha legislativa na Lei nº 7.986/1989, que omite a gratificação natalina para beneficiários de pensões vitalícias. O projeto propõe a alteração da Lei nº 7.986/1989 para garantir o recebimento da gratificação natalina para os beneficiários de pensões vitalícias, que atualmente não têm direito a essa benefício. Além disso, o projeto também busca regular a percepção da gratificação natalina para os aposentados e anistiaados.',
    ' A proposta de emenda constitucional visa criar as polícias penais federal, estaduais e distrital, e estabelecer as suas atribuições e subordinação. O quadro de servidores das polícias penais será preenchido por meio de concurso público ou da transformação dos cargos isolados ou dos cargos de carreira dos atuais agentes penitenciários ou equivalentes. A emenda também estabelece a subordinação das polícias militares e dos corpos de bombeiros militares aos Governadores dos Estados, do Distrito Federal e dos Territórios.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 10,962 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 label
    type string string int
    details
    • min: 44 tokens
    • mean: 142.17 tokens
    • max: 344 tokens
    • min: 36 tokens
    • mean: 137.21 tokens
    • max: 355 tokens
    • 0: ~49.00%
    • 1: ~51.00%
  • Samples:
    sentence_0 sentence_1 label
    O Projeto de Lei do Deputado Federal Celso Sabino (PSDB/PA) objetiva coibir o comportamento de furar a fila na ordem de prioridades para vacinação contra COVID-19 e outras enfermidades, estabelecidas por determinadas campanhas de imunização. O projeto propõe a alteração do Decreto-Lei nº 2.848, de 7 de dezembro de 1940, Código Penal, para tornar crime a violação de prioridade para vacinação. O projeto também prevê a criação de um tipo penal específico para a conduta ignominiosa de furar a fila da ordem de prioridade para vacinação, com pena de detenção de um mês a um ano e multa. Além disso, o projeto estabelece que a pena será aumentada se o agente for um funcionário público e cometer o crime, prevalecendo-se do cargo. O projeto foi apresentado na Câmara dos Deputados em 29 de janeiro de 2021 e conta com o apoio de outros deputados. O projeto de lei nº 1519/2021, apresentado pelo deputado Paulo Bengtson, prioriza o atendimento dos portadores de diabetes nos laboratórios das redes públicas e privadas de saúde durante a realização de exames que necessitem de jejum total. A lei estabelece que os portadores de diabetes têm prioridade na fila de atendimento, juntamente com as gestantes, idosos e pessoas com deficiência. O projeto também determina que os pacientes devem apresentar documentos médicos que comprovem a patologia para ter direito ao tratamento prioritário. A justificativa para o projeto é evitar mal-estar e complicações para os diabéticos, que podem desencadear malefícios à saúde se ficarem muito tempo sem se alimentar. A lei entrará em vigor na data de sua publicação. 0
    O projeto de Lei Institui a obrigatoriedade de estabelecimentos públicos e privados voltados ao ensino ou recreação infantil e fundamental a capacitarem seu corpo docente e funcional em noções básicas de primeiros socorros, para garantir a integridade física e psicológica de seus tutelados e alunos, evitando sequelas fisiológicas e anatômicas irremediáveis. O curso será ministrado por entidades municipais ou estaduais, especializadas em práticas de auxílio imediato e emergencial à população, e as despesas serão orçamentárias. O não cumprimento dos dispositivos da Lei, implicará às instituições de ensino inadimplentes. O Projeto de Lei nº 2015/6891, de 2015, propõe a adição de um artigo ao Decreto nº 9.394/1996, que estabelece as diretrizes e bases da educação nacional, para instituição da obrigatoriedade do ensino de primeiros socorros nos cursos e programas da educação superior. O ensino deverá ter uma duração mínima de 100 horas e ser ministrado por profissionais com formação na área da saúde. A aprovação na disciplina de noções de primeiros socorros será condição para a obtenção do diploma ou certificado de conclusão dos cursos e programas da educação superior. O objetivo do Projeto é reduzir o número de óbitos e lesões graves causadas por acidentes, ao ensejar as noções básicas de primeiros socorros para os estudantes de educação superior. 1
    O Projeto de Lei nº 2.004, de 2004, do Deputado Paulo Delgado, estabelece a tributação de lucros extraordinários obtidos por instituições financeiras, com o objetivo de garantir a justiça fiscal e obter recursos para o pagamento de aposentadorias e programas de estabilização. A proposta estabelece uma adicional de 18% sobre o lucro líquido apurado, com base no patrimônio líquido médio das instituições financeiras. A medida busca evitar que as instituições financeiras auferam lucros extraordinários à custa dos programas de estabilização e da renda dos cidadãos. A justificativa da proposta é que os lucros extraordinários obtidos pelos instituições financeiras são fruto de políticas governamentais de estabilização e fiscalização, e que esses lucros devem ser revertidos para a sociedade, através da contribuição social. O projeto de lei nº 2005, do deputado Carlos Nader, dispõe obrigatoriedade de contratação de seguro para estacionamentos privados, com penalidades para não cumprimento. O seguro deve garantir indenização por danos a veículos e pessoas, e o comprovante de estacionamento deve indicar nome da seguradora e apólice. A lei também estabelece sanções para não cumprimento e justifica a necessidade de proteger direitos dos consumidores. 0
  • Loss: ContrastiveLoss with these parameters:
    {
        "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
        "margin": 0.5,
        "size_average": true
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • num_train_epochs: 1
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • prediction_loss_only: True
  • per_device_train_batch_size: 2
  • per_device_eval_batch_size: 2
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss
0.0912 500 0.0372
0.1824 1000 0.0216
0.2737 1500 0.019
0.3649 2000 0.0163
0.4561 2500 0.0143
0.5473 3000 0.0122
0.6386 3500 0.0111
0.7298 4000 0.0092
0.8210 4500 0.0086
0.9122 5000 0.0072

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.0.0
  • Transformers: 4.39.3
  • PyTorch: 2.2.0
  • Accelerate: 0.30.1
  • Datasets: 2.14.4
  • Tokenizers: 0.15.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

ContrastiveLoss

@inproceedings{hadsell2006dimensionality,
    author={Hadsell, R. and Chopra, S. and LeCun, Y.},
    booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)}, 
    title={Dimensionality Reduction by Learning an Invariant Mapping}, 
    year={2006},
    volume={2},
    number={},
    pages={1735-1742},
    doi={10.1109/CVPR.2006.100}
}