metadata
language: []
library_name: sentence-transformers
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- dataset_size:10K<n<100K
- loss:ContrastiveLoss
base_model: neuralmind/bert-large-portuguese-cased
widget:
- source_sentence: ' O projeto de lei visa alterar o art. 1.788 do Código Civil para normatizar a sucessão de bens e contas digitais do autor da herança de qualidade patrimonial. O projeto pretende tratar do tema relevante e atual de herança digital, que tem sido objeto de diversos casos no Judiciário, e estabelecer medidas para a pacificação de conflitos sociais.'
sentences:
- ' O projeto de lei visa alterar o art. 1.788 do Código Civil, estabelecendo que os herdeiros terão direito acesso e controle sobre contas digitais e arquivos de serviços online de falecidos, sem precisar de autorização judicial. A medida busca regularizar e uniformizar o tratamento das sucessões bens contas digitais, evitando conflitos sociais e garantindo o direito dos herdeiros.'
- ' O projeto de lei visa alterar a redação do Art. 43 da Lei nº 8.078/90, permitindo a inclusão de cadastros negativos de consumidores em bancos de dados, contestando débitos líquidos certos sendo contestados judicialmente. Essa alteração busca adequar as disposições legais às novas necessidades do mercado e evitar a exclusão de consumidores dos bancos de dados. Ao permitir a inclusão de cadastros negativos, o projeto busca evitar a pressão de fornecedores para que os consumidores reconheçam débitos que não são verdadeiros.'
- ' O projeto de lei proíbe as centrais de telemarketing de realizar chamadas automatizadas sem a presença de um operador natural. As chamadas devem ter a opção de contato com um atendente natural no primeiro menu eletrônico. A fiscalização será realizada pelo Sistema Nacional de Defesa do Consumidor do Ministério da Justiça. A aplicação da multa de até R$ 2.000.000,00 pode ser aplicada em caso de descumprimento. O projeto visa proteger os cidadãos brasileiros de chamadas agressivas e invasivas.'
- source_sentence: ' O projeto de lei proíbe a realização de chamadas telefônicas anônimas, obrigando a identificação do remetente e do destinatário. A justificativa é a necessidade de combater crimes e violações de direitos garantidos, que ocorrem por meio do uso inadequado da telefonia. A proibição será aplicada a partir da data de publicação da lei.'
sentences:
- ' O projeto de lei visa obrigar as operadoras de telefonia fixa e celular a informarem o código de acesso do usuário chamador em ligações telefônicas, sem ônus para o usuário receptor. A medida busca reforçar a segurança pública e facilitar as investigações e a prisão de criminosos que se escondem atrás da situação anônima da chamada não identificada. O projeto foi apresentado pelo deputado federal Alberto Fraga e justifica-se com a necessidade de combater a criminalidade que utiliza as telecomunicações para perpetrar crimes.'
- ' O projeto de lei nº 2007 do sr deputado Deley estabelece concessão de visto temporário para estrangeiros que vierem trabalhar temporariamente em eventos esportivos internacionais no Brasil, como a Copa do Mundo de 2014 e as Olimpíadas. A lei também estabelece facilidades para a concessão de visto e registro de entrada no país para essas pessoas. A justificativa para o projeto é a importância dos eventos esportivos brasileiros e a necessidade de garantir a presença de estrangeiros para a realização desses eventos.'
- ' O projeto de lei visa alterar a redação do Art. 43 da Lei nº 8.078/90, permitindo a inclusão de cadastros negativos de consumidores em bancos de dados, contestando débitos líquidos certos sendo contestados judicialmente. Essa alteração busca adequar as disposições legais às novas necessidades do mercado e evitar a exclusão de consumidores dos bancos de dados. Ao permitir a inclusão de cadastros negativos, o projeto busca evitar a pressão de fornecedores para que os consumidores reconheçam débitos que não são verdadeiros.'
- source_sentence: ' O projeto de lei visa permitir que os contribuintes deduzam das receitas tributáveis as despesas realizadas com matrículas e mensalidades de cursos de idiomas estrangeiros, com o objetivo de incentivar a educação e o desenvolvimento profissional. A proposta foi apresentada pelo deputado Fernando Coruja e está sendo discutida no Congresso Nacional.'
sentences:
- ' O projeto de lei nº 2016, de 2016, proposto pelo deputado Aureo, permite a dedução de pagamentos relativos a despesas com cursos de idiomas estrangeiros para apuração do imposto sobre a renda das pessoas físicas. A justificativa para a proposta é que a rede pública de ensino não é capaz de dotar os brasileiros das habilidades necessárias para dominar um idioma estrangeiro, e que a dedução deveria incentivar o custeio dos cursos realizados em escolas privadas. O projeto prevê a dedução de despesas com cursos de idiomas estrangeiros até o limite anual individual de NR$ 2.000,00.'
- ' O presente Projeto de Lei visa reformular o Ensino Médio, com o objetivo de torná-lo mais atraente e de qualidade, oferecendo opções formativas para os alunos, com ênfase em línguas, matemáticas, ciências e humanidades, além de habilidades técnicas e sociais. Além disso, estabelece a jornada escolar em tempo integral, permitindo a ampliação das vagas de ensino médio e a redução da taxa de abandono. O projeto também prevê a criação de programas de formação para os professores e a revisão dos conteúdos curriculares.'
- ' O projeto de lei dispõe que as operadoras telefonia móvel devem manter um cadastro atualizado com informações dos proprietários dos aparelhos celulares, e que os usuários devem fornecer cópias simples das informações de identificação para a operadora. Além disso, o projeto estabelece penalidades para a utilização indevida dos aparelhos celulares, e prevê a bloqueio do IMEI do aparelho em caso de perda, furto ou roubo. O objetivo do projeto é proteger o patrimônio dos cidadãos e garantir a segurança pública.'
- source_sentence: ' O projeto de lei do deputado Washington Reis dispõe isenção ao pagamento de pedágio para motocicletas similares em rodovias federais. A justificativa para essa proposição é que esses veículos causam menos danos às estradas e ao meio ambiente, além de representarem uma economia de gasolina e uma diminuição no volume do tráfego.'
sentences:
- ' O projeto de lei proposto por Deputado Gutemberg Reis dispõe sobre a isenção de pagamento de pedágio para motocicletas e similares em rodovias federais. A justificativa para essa proposta é que esses veículos, devido às suas características, não causam danos às estradas e ao meio-ambiente, e que eles representam economia de gasolina, diminuição do volume de tráfego e diminuição dos índices de poluição. O projeto de lei busca contemplar esses veículos com uma isenção de pagamento de pedágio em rodovias federais.'
- ' O projeto de lei visa alterar o Código Eleitoral para instituir o sistema majoritário uninominal nas eleições para vereadores em municípios com mais de 200.000 eleitores, permitindo que os eleitores tenham certeza de que o seu voto tem efeito direto na escolha do vereador e reduzindo custos de financiamento das campanhas. Além disso, a proposta prevê a extinção do horário eleitoral gratuito no rádio e na televisão para os candidatos a vereador, considerando que o sistema distrital será mais eficaz e menos dispendioso.'
- ' O projeto de lei proíbe a realização de ligações telefônicas não identificáveis, com o objetivo de inibir a proliferação de ligações confidenciais com fins de telemarketing e cobrança, e também para reduzir os índices de criminalidade no país. O projeto mantém o dispositivo da Lei Geral de Telecomunicações que assegura ao usuário o direito à não divulgação do seu número telefônico, mas apenas em listas de assinantes. O projeto estabelece um prazo de noventa dias para que a norma proposta passe a vigorar, permitindo que as operadoras adaptem suas redes para adequação ao disposto na proposição.'
- source_sentence: ' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de 19 de setembro de 1990, para permitir o atendimento de serviços saúde para os soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros que lutaram na guerra.'
sentences:
- ' O projeto de lei apresentado pelo deputado Mauro Nazif em 2007 visa sanar uma falha legislativa na Lei nº 7.986/1989, que omite a gratificação natalina para beneficiários de pensões vitalícias. O projeto propõe a alteração da Lei nº 7.986/1989 para garantir o recebimento da gratificação natalina para os beneficiários de pensões vitalícias, que atualmente não têm direito a essa benefício. Além disso, o projeto também busca regular a percepção da gratificação natalina para os aposentados e anistiaados.'
- ' A proposta de emenda constitucional visa criar as polícias penais federal, estaduais e distrital, e estabelecer as suas atribuições e subordinação. O quadro de servidores das polícias penais será preenchido por meio de concurso público ou da transformação dos cargos isolados ou dos cargos de carreira dos atuais agentes penitenciários ou equivalentes. A emenda também estabelece a subordinação das polícias militares e dos corpos de bombeiros militares aos Governadores dos Estados, do Distrito Federal e dos Territórios.'
- ' A proposta de lei visa acrescentar as metas brasileiras de redução de emissões para os períodos pós-2020, e dá outras providências. O Congresso Nacional decreta que a Política Nacional sobre Mudança do Clima será instituída, e as metas brasileiras de redução de emissões propostas para os períodos de 2020 a 2025 e de 2025 a 2030. Além disso, a Lei acrescenta o art. 12-A, que estabelece que as propostas brasileiras sobre prevenção, mitigação e adaptação às mudanças do clima devem ser precedidas de consulta pública e divulgadas em todo o território nacional.'
pipeline_tag: sentence-similarity
SentenceTransformer based on neuralmind/bert-large-portuguese-cased
This is a sentence-transformers model finetuned from neuralmind/bert-large-portuguese-cased. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: neuralmind/bert-large-portuguese-cased
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 1024 tokens
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("josedossantos/urf-summary-bertimbau")
# Run inference
sentences = [
' O projeto de lei visa alterar o artigo 45 da Lei nº 8.080, de 19 de setembro de 1990, para permitir o atendimento de serviços saúde para os soldados da Borracha que participaram da Segunda Guerra Mundial, e seus familiares dependentes. O projeto também busca reconhecer o esforço e dedicação dos brasileiros que lutaram na guerra.',
' O projeto de lei apresentado pelo deputado Mauro Nazif em 2007 visa sanar uma falha legislativa na Lei nº 7.986/1989, que omite a gratificação natalina para beneficiários de pensões vitalícias. O projeto propõe a alteração da Lei nº 7.986/1989 para garantir o recebimento da gratificação natalina para os beneficiários de pensões vitalícias, que atualmente não têm direito a essa benefício. Além disso, o projeto também busca regular a percepção da gratificação natalina para os aposentados e anistiaados.',
' A proposta de emenda constitucional visa criar as polícias penais federal, estaduais e distrital, e estabelecer as suas atribuições e subordinação. O quadro de servidores das polícias penais será preenchido por meio de concurso público ou da transformação dos cargos isolados ou dos cargos de carreira dos atuais agentes penitenciários ou equivalentes. A emenda também estabelece a subordinação das polícias militares e dos corpos de bombeiros militares aos Governadores dos Estados, do Distrito Federal e dos Territórios.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
Unnamed Dataset
- Size: 10,962 training samples
- Columns:
sentence_0
,sentence_1
, andlabel
- Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 label type string string int details - min: 44 tokens
- mean: 142.17 tokens
- max: 344 tokens
- min: 36 tokens
- mean: 137.21 tokens
- max: 355 tokens
- 0: ~49.00%
- 1: ~51.00%
- Samples:
sentence_0 sentence_1 label O Projeto de Lei do Deputado Federal Celso Sabino (PSDB/PA) objetiva coibir o comportamento de furar a fila na ordem de prioridades para vacinação contra COVID-19 e outras enfermidades, estabelecidas por determinadas campanhas de imunização. O projeto propõe a alteração do Decreto-Lei nº 2.848, de 7 de dezembro de 1940, Código Penal, para tornar crime a violação de prioridade para vacinação. O projeto também prevê a criação de um tipo penal específico para a conduta ignominiosa de furar a fila da ordem de prioridade para vacinação, com pena de detenção de um mês a um ano e multa. Além disso, o projeto estabelece que a pena será aumentada se o agente for um funcionário público e cometer o crime, prevalecendo-se do cargo. O projeto foi apresentado na Câmara dos Deputados em 29 de janeiro de 2021 e conta com o apoio de outros deputados.
O projeto de lei nº 1519/2021, apresentado pelo deputado Paulo Bengtson, prioriza o atendimento dos portadores de diabetes nos laboratórios das redes públicas e privadas de saúde durante a realização de exames que necessitem de jejum total. A lei estabelece que os portadores de diabetes têm prioridade na fila de atendimento, juntamente com as gestantes, idosos e pessoas com deficiência. O projeto também determina que os pacientes devem apresentar documentos médicos que comprovem a patologia para ter direito ao tratamento prioritário. A justificativa para o projeto é evitar mal-estar e complicações para os diabéticos, que podem desencadear malefícios à saúde se ficarem muito tempo sem se alimentar. A lei entrará em vigor na data de sua publicação.
0
O projeto de Lei Institui a obrigatoriedade de estabelecimentos públicos e privados voltados ao ensino ou recreação infantil e fundamental a capacitarem seu corpo docente e funcional em noções básicas de primeiros socorros, para garantir a integridade física e psicológica de seus tutelados e alunos, evitando sequelas fisiológicas e anatômicas irremediáveis. O curso será ministrado por entidades municipais ou estaduais, especializadas em práticas de auxílio imediato e emergencial à população, e as despesas serão orçamentárias. O não cumprimento dos dispositivos da Lei, implicará às instituições de ensino inadimplentes.
O Projeto de Lei nº 2015/6891, de 2015, propõe a adição de um artigo ao Decreto nº 9.394/1996, que estabelece as diretrizes e bases da educação nacional, para instituição da obrigatoriedade do ensino de primeiros socorros nos cursos e programas da educação superior. O ensino deverá ter uma duração mínima de 100 horas e ser ministrado por profissionais com formação na área da saúde. A aprovação na disciplina de noções de primeiros socorros será condição para a obtenção do diploma ou certificado de conclusão dos cursos e programas da educação superior. O objetivo do Projeto é reduzir o número de óbitos e lesões graves causadas por acidentes, ao ensejar as noções básicas de primeiros socorros para os estudantes de educação superior.
1
O Projeto de Lei nº 2.004, de 2004, do Deputado Paulo Delgado, estabelece a tributação de lucros extraordinários obtidos por instituições financeiras, com o objetivo de garantir a justiça fiscal e obter recursos para o pagamento de aposentadorias e programas de estabilização. A proposta estabelece uma adicional de 18% sobre o lucro líquido apurado, com base no patrimônio líquido médio das instituições financeiras. A medida busca evitar que as instituições financeiras auferam lucros extraordinários à custa dos programas de estabilização e da renda dos cidadãos. A justificativa da proposta é que os lucros extraordinários obtidos pelos instituições financeiras são fruto de políticas governamentais de estabilização e fiscalização, e que esses lucros devem ser revertidos para a sociedade, através da contribuição social.
O projeto de lei nº 2005, do deputado Carlos Nader, dispõe obrigatoriedade de contratação de seguro para estacionamentos privados, com penalidades para não cumprimento. O seguro deve garantir indenização por danos a veículos e pessoas, e o comprovante de estacionamento deve indicar nome da seguradora e apólice. A lei também estabelece sanções para não cumprimento e justifica a necessidade de proteger direitos dos consumidores.
0
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size
: 2per_device_eval_batch_size
: 2num_train_epochs
: 1multi_dataset_batch_sampler
: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseprediction_loss_only
: Trueper_device_train_batch_size
: 2per_device_eval_batch_size
: 2per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falsefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: round_robin
Training Logs
Epoch | Step | Training Loss |
---|---|---|
0.0912 | 500 | 0.0372 |
0.1824 | 1000 | 0.0216 |
0.2737 | 1500 | 0.019 |
0.3649 | 2000 | 0.0163 |
0.4561 | 2500 | 0.0143 |
0.5473 | 3000 | 0.0122 |
0.6386 | 3500 | 0.0111 |
0.7298 | 4000 | 0.0092 |
0.8210 | 4500 | 0.0086 |
0.9122 | 5000 | 0.0072 |
Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.0.0
- Transformers: 4.39.3
- PyTorch: 2.2.0
- Accelerate: 0.30.1
- Datasets: 2.14.4
- Tokenizers: 0.15.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
ContrastiveLoss
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}