pablosi's picture
Add new SentenceTransformer model
91fa40d verified
metadata
language:
  - es
license: apache-2.0
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:5036
  - loss:MatryoshkaLoss
  - loss:MultipleNegativesRankingLoss
base_model: littlejohn-ai/bge-m3-spa-law-qa
widget:
  - source_sentence: ¿Qué tipo de obras no dan derecho a practicar la deducción en viviendas?
    sentences:
      - >-
        en el Real Decreto

        2066/2008, de 12 de diciembre, por el que se regula el Plan Estatal de
        Vivienda y

        Rehabilitación 2009-2012, así como por las obras de instalación de
        infraestructuras

        de telecomunicación realizadas durante dicho período que permitan el
        acceso a

        Internet y a servicios de televisión digital en la vivienda del
        contribuyente.


        No darán derecho a practicar esta deducción las obras que se realicen en



        viviendas afectas a una actividad económica, plazas de garaje, jardines,
        parques,

        piscinas e instalaciones deportivas y otros elementos análogos.


        La base de esta deducción estará constituida por las cantidades
        satisfechas,



        mediante tarjeta de crédito o débito, transferencia bancaria, cheque
        nominativo o

        ingreso en cuentas en entidades de crédito, a las personas o entidades
        que realicen

        tales obras. En ningún caso, darán derecho a practicar esta deducción
        las cantidades

        satisfechas mediante entregas de dinero de curso legal.



        -----


        # BOLETÍN OFICIAL DEL ESTADO



        **Núm. 108** **Viernes 6 de mayo de 2011** **Sec. I.  Pág. 45113**


        La base máxima anual de esta deducción será de:



        a) cuando la base imponible sea igual o inferior a 53.007,20 euros
        anuales:



        6.750 euros a
      - >-
        s/kilogramo. apartado 3.

        Materias inhibidoras (MI): 725.42 pesetas~k-equitox. 5. EI regimen de
        autorizaciones para las operaciones

        Sales solubles (SOL): 580.35 pesetas/Sm /centlme- a que hacen referencia
        los puntos 3 y 4 debe ser el


        tro. previsto por los artlculos 31 y 32 de la Ley de Presu-


        Incremento de temperatura (IT): 0.007681 pese- puestos de 1995.

        tas/metro cubico;oC.

        Zona B. Artlculo 3. _Ordenaci6n de pagos._

        Usos domesticos: 28.60 pesetas/metro cubico y Prd. Se anade al artlculo
        48.1 del texto refundido de la

        Usos industriales: 35.91 pesetas/metro cubico y Prd. Ley de Finanzas
        Publicas de Cataluna. aprobado por el

        Materias en suspensi6n (MES): 36.26 pesetas/kilo- Decreto legislativo
        9/1994. de 13 de julio. un nuevo

        gramo. . . parrafo con la siguiente redacci6n:

        Materias oxidables (MO): 72.54 pesetas/kılogramo.


        ."La ordenaci6n del pago puede efectuarse


        Materias inhibidoras (MI): 725.42 pesetas~k-equitox.


        mediante la. firma de una orden individual 0 de


        Sales solubles (SOL): 580.35 pesetas/Sm /centfme-


        un resumen elaborado por medios informaticos y


        tro.


        comprensivo de varias 6rdenes.»


        Incremento de· temperatura (IT): 0.007681 pese-

        tas/metro cubico;oC.


        Disposici6n 
      - >2+
         de la Repúbl1ca

        procedente. A dicho efecto, el Presidente de- la Subcomisión de


        Argentina y el Ministerio de Trabajo de España efectuarán,


        Salarios está facultado para dirigirse directamente a los ser-


        #### de común acuerdO y con tres meses de antlcipac16n, la ~


        vicios o Departamentos oficiales, cualquiera que sea su ads-


        #### tiva programa.ción anua.l.


        cripción administrativa, así como a los Organismos Sindicales,

        recabando los datos e informes precisos y debiendo los Orgar ARTÍCULO nI


        nismos requeridos cumplimentarlos en el pla:zo máXimo <le


        quince días. Cada pa.ls otorgará al otro hasta cinco becas anuales para.


        #### La SubcomisIón de Salarios elaborará cada tres meses un estudios de
        formación y especialización en Centros relacionados

        informe expres1vo de la evolución de las rentas·· saláriale...c; y con
        los temas ql1e ~ hubieren selecclonado  eom1in acuerdo.



        -----

  - source_sentence: ¿Qué se promoverá en cuanto a la participación de mujeres en la economía?
    sentences:
      - >-
        Artículo 63. Coordinación de los poderes públicos de Andalucía para la
        igualdad de mujeres y hombres. Se creará la Comisión de coordinación de
        las políticas autonómicas y locales para la igualdad de género con el
        objeto de coordinar e impulsar la integración del enfoque de género en
        las políticas y programas, en materia de igualdad de mujeres y hombres,
        desarrollados por las distintas Administraciones públicas de la
        Comunidad Autónoma.
      - >-
        # BOLETÍN OFICIAL DEL ESTADO



        **Núm. 212** **Miércoles 4 de septiembre de 2013** **Sec. I.  Pág.
        64199**


        ### I. DISPOSICIONES GENERALES



        ## MINISTERIO DE INDUSTRIA, ENERGÍA Y TURISMO


        #### 9326 Resolución de 27 de agosto de 2013, de la Secretaría de Estado
        de Turismo,

        _por la que se publica el Acuerdo de Consejo de Ministros de 26 de julio
        de_

        _2013, por el que se modifica en lo relativo a previsión de gastos
        financieros_

        _del ICO y su financiación, el Acuerdo de 29 de mayo de 2009, que
        modificó la_

        _normativa reguladora de los préstamos previstos en el Plan de
        Renovación de_

        _Instalaciones Turísticas (Plan Renove Turismo 2009) del Ministerio de_

        _Industria, Turismo y Comercio y amplió su dotación económica._



        El Consejo de Ministros, en su reunión del 26 de julio de 2013, a
        propuesta de los



        Ministros de Industria Energía y Turismo, y de Economía y Competitividad
        adoptó el

        acuerdo referenciado en el título cuyo texto se inserta a continuación.


        La normativa reguladora establecida en este acuerdo debe ser publicada
        en el



        «Boletín Oficial del Estado», a tenor de lo establecido en el artículo
        52.1 de la Ley 30/1992,

        de 26 de noviembre, de Régimen Jurídico de las Administracion
      - >-
        7. La promoción del acceso a los recursos de todo tipo a las mujeres que
        viven en el medio rural y su participación plena, igualitaria y efectiva
        en la economía y en la sociedad.
  - source_sentence: ¿Cuándo entró en vigor el presente anexo en España?
    sentences:
      - >-
        y

        distantes entre sí. En cada una de estos lugares irán estibados cuando
        menos un equipo de bombero y un

        juego de equipo individual.



        .6 Si la Administración de un Estado de abanderamiento considera que las
        disposiciones en materia de equipos

        obligatorios a bordo contenidas en la presente regla no son razonables o
        técnicamente adecuadas, el buque

        podrá ser eximido, con arreglo a lo dispuesto en el artículo 9, apartado
        3, de la presente Directiva, de una o

        más de dichas disposiciones.


        **12 Cuestiones diversas (R 18)**



        BUQUES NUEVOS DE CLASES B, C y D y BUQUES EXISTENTES DE CLASE B:


        .1 Cuando las divisiones de clase “A” estén perforadas para dar paso a
        cables eléctricos, tuberías, troncos,

        conductos, etc., o para aceptar esloras, baos u otros elementos
        estructurales, se tomarán las medidas razonables

        y practicables para que no disminuya la resistencia al fuego.



        En lo que respecta a los buques construidos el 1 de enero de 2003 o
        posteriormente cuyas divisiones de clase

        “A” estén perforadas, estas perforaciones se someterán a prueba con
        arreglo al Código de procedimientos de

        ensayo de exposición al fuego para asegurarse de que no disminuya la
        resistencia al fuego de las division
      - >+
        rma Internacional para Autorizaciones de Uso Terapéutico
        _(International_



        _Standard for Therapeutic Use Exemptions)._



        -----


        # BOLETÍN OFICIAL DEL ESTADO


        **Núm. 127** **Sábado 25 de mayo de 2024** **Sec. I.  Pág. 59583**



        PBD: pasaporte biológico del deportista.

        programa del PBD: programa del pasaporte biológico del deportista.

        sistema ADAMS: sistema de gestión y administración antidopaje
        (Anti-Doping

        Administration and Management System).


        TAD: Tribunal de Arbitraje Deportivo.

        UGPD: unidad de gestión del pasaporte del deportista.



        *******


        El presente anexo entró en vigor, de forma general y para España, el 1
        de enero

        de 2023, de conformidad con lo establecido en el párrafo 3 del artículo
        34 de la

        Convención Internacional contra el dopaje en el deporte.


        Madrid, 17 de mayo de 2024.–La Secretaria General Técnica, Rosa
        Velázquez

        Álvarez.



        -----

      - >-
        para la autorización de su puesta en circula-


        General de Politica Arancelaria e Importación. previo informe ción, de
        acuerdo 'con el Real Decreto 185111978, de 10 de julio,

        de la Dirección' General de la Energía del Ministerio da Indus- y
        disposiciones concordantes.· .

        ##### tria y Energia. El contingente establecido por la presente Orden
        4. Las Entidades Financieras que emitan participaciones

        no será aplicable a las mercancias acogidas 'a cualquier modall-
        hipotece.rias deberán comunicar mensualmente a la Dirección

        ##### dad de tráfico de perfeccionamiento activo. _ General del Tesoro y
        Política Financiera el volumen y caracte-


        risticas financieras de las emitidas durante- el mes anterior.


        Tercero.-Las expediciones de hulla coquizable que se impor-


        ten en el año 1985 con li~ncias expedidas con cargo al contin-
        Tercero...~l. Las Entidades Financieras que hubieran emi·

        gente. libre de derechos, correspondiente a! año anterior se ad· tldo
        cédulas .y' bonqe hipotecarlos con la cobertura de présta-

        mitirAn con libertad de derechos. debh:mdo deducirse por la mos
        hipotecarios convalidados.. deberán reinvertir el· producto

        Dl.rección General de Política Arancelaria e Importación de la
  - source_sentence: ¿Qué se entiende por discriminación directa según la Ley?
    sentences:
      - >-
        :e 0 (ım:ınt;?caire». c10nde


         ee : «Ayudante de cort:ı.OOr ... 8», debe decır: «.'\j'Udante de


        ###### 1\1 1 N 1 S TER 1 0 carta dar ... 9».


        En i:ı mism::ı p:igina. Mcdisteria a la medida y en serıe, don-


        ## n ! ... [k ] LA GOBERNACION de dice: «Ayudanta ." Sı), debe decir; «~
        ... yudanta .. , 9),


        En el mismo «Boletin Ofici:ıl del Est~doı). pa~ina 10337, pri-


        _RESOLUC!O_\'_ _de_ _la_ _Direcci6n General_ _de_ _sanidad_ por mera
        columna. Corbateria y paİlOleri;ı d2 fanta.\ia, donde dice:·

        _:a._ _fj!:c_ se _ciicWn_ 11 onnas _sobre_ _reconocimiento_ de _los_
        «A~'Udante '" 8), debe decir: «A)'ud::ınte ... 9». En h misma _co-_

        _("crda,_ _wcri/kacios_ _en_ _domicilios_ _particulares._ lumna.
        confecci6n de sombreros ee senora, donde dice; «Aru-


        dante de Planchado!' .. , 8», dcbc decir: «Ayud:ı.nte de Plancha·


        Proxima la :ech:ı cn quc las Jef:ıtur:ı.s de Sanidad han de dor ... 9».
        Eıı la misma columna. Ve;os, man,os y mantillas. dorı­


        ori:ı:ıizıl" e:-ı öu:; r(:ö~ectivas provinci:ı.s el reconocimiento oa-
        de dice: «Ayudante ... 8». debe decir: «A)'udantc ... 9».


        nit:ı:io de bs :cses porcin:.ıs sacrificada.s en domicilios particu- En
        el mismo «Boleti!ı Oficial del Estado), p:i~jna 
      - >-
        A los efectos de esta ley, se entiende por discriminación directa:
        Situación en que se encuentra una persona o grupo en que se integra que
        sea, haya sido o pudiera ser tratada de manera menos favorable que otras
        en situación análoga o comparable por razón de orientación sexual e
        identidad sexual, expresión de género o características sexuales.
      - >-
        ## I. Disposiciones generales


        ### TRIBUNAL CONSTITUCIONAL asignaturasÁrt. 3.° Lospor alumnosrazón de
        queotrosobtenganestudios lanacionalesconvalidacióno extrande­


        jeros abonarán el 40 por 100 de las tasas establecidas para

        las asignaturas sueltas. Las demás tasas se satisfarán en la

        cuantía integra, en la medida en que incurren en el hecho


        #### 21356 planteadoRECURSOporde inconstitucionalidadel Presidente del
        Gobiernonúmerocontra646/1984,la imponible.

        _Ley_ _1/1984,_ _de_ _20_ _de_ _febrero,_ _del_ _Parlamento_ _de_
        DISPOSICION FINAL

        _Galicia._


        Se autoriza a los Ministros de Economía y Hacienda y de


        El Tribunal Constitucional, por providencia de 30 de agosto Cultura para
        dictar las normas necesarias en orden a la apli­

        actual, ha admitido a trámite el recurso de inconstitucionalidad cación
        del presente Real Decreto.

        número 646/1984, planteado por el Presidente del Gobierno, con­

        tra la Ley 1/1984, de 20 de febrero, del Parlamento de Galicia, Dado en
        Madrid a 12 de septiembre de 1984.

        del fondo de compensación financiera. Y se hace saber que en

        el mencionado recurso se ha invocado por el Presidente del JUAN CARLOS
        R.

        Gobierno el artículo 161.2 de la Constitución, que produce de
  - source_sentence: >-
      ¿Cuál es la disposición que se refiere a la hora de cierre de los
      establecimientos públicos en días laborables según el artículo 1.°?
    sentences:
      - >-
        n de las adscripciones o representaciones a que

        se refieren distintos apartados del artículo 11,2 del citado De­


        #### Art. 2:° Los sábados y vísperas de días festivos, los espec- creto
        orgánico del Consejo Nacional de Educación, táculos podrán terminar y
        los establecimientos públicos podrán Este Ministerio, haciendo uso de
        las atribuciones que le con­ cerrar media hora más tarde de la que se
        determina en el fiere la disposición final segunda del citado Decreto
        orgánico, artículo l.° y de conformidad con el dictamen de la Asesoría
        Jurídica del
         Departamento, ha tenido a bien disponer lo siguiente:
         Art. 3 La hora de cierre de los frontones podrá prorrogar­
        se excepcionalmente, en caso de empate de los partidos, hasta
        Primero.—Lo dispuesto en el artículo 14 del Decreto 2763/1971,


        de 21 de octubre, que organizó el Consejo Nacional de Educa­


        #### que sea necesaria, siempre que éstos hubieran comenzado a la hora
        establecida. ción, respecto de los Consejeros que lo fueran por razón de
        su
         cargo, debe entenderse no sólo respecto de los Consejeros natos,
         Art. 4 Los bares interiores de los hoteles podrán retrasar sino también de los Consejeros designados por este Ministerio, su hora
      - >-
        o corrientes** 0330 ........................


        **TOTAL ACTIVO (A+B)** 0340 ........................


        **PASIVO Y PATRIMONIO NETO**



        **A) PASIVO CORRIENTE** 0350 ........................


        **I. Periodificaciones** 0360 ........................

        **II. Acreedores y cuentas a pagar** 0370 ........................

        **III. Deudas con empresas del grupo y asociadas a corto plazo** 0380
        ........................

        **IV. Deudas a corto plazo** 0390 ........................

        **V. Provisiones a corto plazo** 0400 ........................

        **VI. Otros pasivos corrientes** 0410 ........................


        **B) PASIVO NO CORRIENTE** 0420 ........................


        **I. Periodificaciones** 0430 ........................

        **II. Pasivos por impuesto diferido** 0440 ........................

        **III. Deudas con empresas del grupo y asociadas a largo plazo** 0450
        ........................

        **IV. Deudas a largo plazo** 0460 ........................

        **V. Provisiones a largo plazo** 0470 ........................

        **VI. Otros pasivos no corrientes** 0480 ........................

        **TOTAL PASIVO (A+B)** 0490 ........................


        **C) PATRIMONIO NETO** 0500 ........................


        **C-1) FONDOS REEMBOLSABLES** 0510 ....
      - >-
        plan los requisitos previstos en el apartado 4 del

        mencionado artículo 63.


        4. La Comisión Nacional de los Mercados y la Competencia revisará, en
        coordinación



        con las autoridades reguladoras involucradas, el modelo adoptado en
        relación con dichas

        subastas regionales y su compatibilidad con el modelo de acoplamiento
        único intradiario y

        las subastas paneuropeas.


        5. Los ingresos obtenidos como resultado de la asignación de capacidad
        en el



        mercado intradiario en la interconexión España-Francia y España-Portugal
        tendrán la

        consideración de «rentas de congestión».


        6. El Operador del Sistema y el Operador del Mercado aplicarán la
        metodología para



        la distribución de las rentas de congestión derivadas del acoplamiento
        del mercado

        intradiario, según lo previsto en el artículo 73 del Reglamento (UE)
        2015/1222.


        Artículo 12. _Acoplamiento del mercado intradiario continuo europeo._



        El mecanismo de acoplamiento del mercado intradiario continuo europeo
        seguirá el



        siguiente proceso:


        1. El Operador del Sistema calculará la capacidad de intercambio de cada



        interconexión, según lo establecido en el artículo 14 del Reglamento
        (UE) 2015/1222, en

        coordinación con los operadores de los sis
datasets:
  - pablosi/boe_sintetic_question_context
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
model-index:
  - name: BGE large Legal Spanish Spa Law QA
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 1024
          type: dim_1024
        metrics:
          - type: cosine_accuracy@1
            value: 0.22817460317460317
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.7599206349206349
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.8333333333333334
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.8888888888888888
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.22817460317460317
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2533068783068783
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.16666666666666669
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.08888888888888889
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.22817460317460317
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.7599206349206349
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.8333333333333334
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.8888888888888888
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.608877402658626
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5142416225749558
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5191823753354601
            name: Cosine Map@100
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: dim 768
          type: dim_768
        metrics:
          - type: cosine_accuracy@1
            value: 0.20634920634920634
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.7579365079365079
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.8313492063492064
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.8849206349206349
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.20634920634920634
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2526455026455027
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.1662698412698413
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.0884920634920635
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.20634920634920634
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.7579365079365079
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.8313492063492064
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.8849206349206349
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.5994157051139072
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.5026470773494582
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.5078514224174326
            name: Cosine Map@100

BGE large Legal Spanish Spa Law QA

This is a sentence-transformers model finetuned from littlejohn-ai/bge-m3-spa-law-qa on the boe_sintetic_question_context dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("pablosi/bge-m3-spa-law-qa-trained")
# Run inference
sentences = [
    '¿Cuál es la disposición que se refiere a la hora de cierre de los establecimientos públicos en días laborables según el artículo 1.°?',
    'n de las adscripciones o representaciones a que\nse refieren distintos apartados del artículo 11,2 del citado De\xad\n\n#### Art. 2:° Los sábados y vísperas de días festivos, los espec- creto orgánico del Consejo Nacional de Educación, táculos podrán terminar y los establecimientos públicos podrán Este Ministerio, haciendo uso de las atribuciones que le con\xad cerrar media hora más tarde de la que se determina en el fiere la disposición final segunda del citado Decreto orgánico, artículo l.° y de conformidad con el dictamen de la Asesoría Jurídica del\n Departamento, ha tenido a bien disponer lo siguiente:\n Art. 3.° La hora de cierre de los frontones podrá prorrogar\xad\nse excepcionalmente, en caso de empate de los partidos, hasta Primero.—Lo dispuesto en el artículo 14 del Decreto 2763/1971,\n\nde 21 de octubre, que organizó el Consejo Nacional de Educa\xad\n\n#### que sea necesaria, siempre que éstos hubieran comenzado a la hora establecida. ción, respecto de los Consejeros que lo fueran por razón de su\n cargo, debe entenderse no sólo respecto de los Consejeros natos,\n Art. 4.° Los bares interiores de los hoteles podrán retrasar sino también de los Consejeros designados por este Ministerio, su hora',
    'o corrientes** 0330 ........................\n\n**TOTAL ACTIVO (A+B)** 0340 ........................\n\n**PASIVO Y PATRIMONIO NETO**\n\n\n**A) PASIVO CORRIENTE** 0350 ........................\n\n**I. Periodificaciones** 0360 ........................\n**II. Acreedores y cuentas a pagar** 0370 ........................\n**III. Deudas con empresas del grupo y asociadas a corto plazo** 0380 ........................\n**IV. Deudas a corto plazo** 0390 ........................\n**V. Provisiones a corto plazo** 0400 ........................\n**VI. Otros pasivos corrientes** 0410 ........................\n\n**B) PASIVO NO CORRIENTE** 0420 ........................\n\n**I. Periodificaciones** 0430 ........................\n**II. Pasivos por impuesto diferido** 0440 ........................\n**III. Deudas con empresas del grupo y asociadas a largo plazo** 0450 ........................\n**IV. Deudas a largo plazo** 0460 ........................\n**V. Provisiones a largo plazo** 0470 ........................\n**VI. Otros pasivos no corrientes** 0480 ........................\n**TOTAL PASIVO (A+B)** 0490 ........................\n\n**C) PATRIMONIO NETO** 0500 ........................\n\n**C-1) FONDOS REEMBOLSABLES** 0510 ....',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric dim_1024 dim_768
cosine_accuracy@1 0.2282 0.2063
cosine_accuracy@3 0.7599 0.7579
cosine_accuracy@5 0.8333 0.8313
cosine_accuracy@10 0.8889 0.8849
cosine_precision@1 0.2282 0.2063
cosine_precision@3 0.2533 0.2526
cosine_precision@5 0.1667 0.1663
cosine_precision@10 0.0889 0.0885
cosine_recall@1 0.2282 0.2063
cosine_recall@3 0.7599 0.7579
cosine_recall@5 0.8333 0.8313
cosine_recall@10 0.8889 0.8849
cosine_ndcg@10 0.6089 0.5994
cosine_mrr@10 0.5142 0.5026
cosine_map@100 0.5192 0.5079

Training Details

Training Dataset

boe_sintetic_question_context

  • Dataset: boe_sintetic_question_context at 2391ba7
  • Size: 5,036 training samples
  • Columns: question and context
  • Approximate statistics based on the first 1000 samples:
    question context
    type string string
    details
    • min: 3 tokens
    • mean: 26.99 tokens
    • max: 66 tokens
    • min: 2 tokens
    • mean: 279.97 tokens
    • max: 964 tokens
  • Samples:
    question context
    ¿Cuáles son las funciones que corresponden a la Vicesecretaría General Técnica en relación con el régimen interior y económico? Explotación

    ###### Artículo octavo y de Señales Marítimas.

    A la Vicesecretaría General Técnica corresponden las funcio~

    nes relativas al régimen interior y económico, información, Artículo decimosexto
    iniciativas, derecho de petición, archivo, biblioteca, documen-

    La Dirección General de Transportes Terrestres estará. inte-

    tación, relaciones internacionales y demás que le encomiende

    grada por las siguientes unidades:

    el Secretario general Técnico.

    - Subdirección General de Planificación y Obras.

    ###### Articulo noveno - Subdirección General de Explotación.

    La Subdirección General de Programación Económica. tendrá Artículo decimoséptimo
    a. su 'cargo la realización de estudios económicos, elaboración
    de las estadisticas del Departamento, estudios y proyectos de A la Subdirección General de Planificación y Obras le, correS'"
    financiación e informes sobre inversiones y realizaciones del ponderá el examen de anteproye...
    ¿Qué tipo de documentación oficial deben exhibir los funcionarios y agentes de las administraciones comunes del país limitrofe para acreditar su nacionalidad, identidad, calidad y naturaleza de sus funciones? ones conı­
    neD!"'.! . bajo lOS :ıuspicios de la Comisi6n econ6mic:ı Europea petent,sdel pais limitrofe deberiıı llevar el uniforme ıiacional
    con el fin. de !'acilitar el paso de ıa. fronteras a l:l.'i memıncias o el signo discintivo prescl'ito por los reglamentos de dicho pais.
    transportadas POl' via .fcrrea. 3. 10s funcionarios y agentes de las administraciones com-
    aeuerdan 10 siguiente': petentes del pais limitrofe que tengaıı que dirigirse a La esıa­

    cl6n p:mi la reallzacl6n de la.> ln,pecciones previstas POl' ci pre-

    TITULOI sente Convenio queoar:ın dispensados de las formalidades de

    pasaportes. La exhibici6n de su documentaci6n cficial ser:i. su-

    CreQon y regiınen de cstadorıt's de jronterQ con inspectiones ficiente para acreditar su nacionalidad. su jdenıidad. su ca.lidad

    nC!dr...
    a.!rz ;:u.:::ta-p--.ıcsta:; y la naturaleza de sus funcia:ıes.

    4. LCIlI lunciona.rios )' agent.>s mencıonad05 en 105 parra-

    Artıculo primero fas 2 y 3 de! presente articulo recibiri...
    ¿Cuál es el período máximo de vinculación provisional o a prueba que pueden establecer los estatutos de una sociedad cooperativa de segundo grado? ría en los estatutos, que también podrá regular un período de vinculación
    provisional o a prueba de hasta dos años.

    3. El socio persona jurídica que pretenda darse de baja habrá de cursar un preaviso
    de al menos un año. Trascurrido el periodo de preaviso y antes de su efectiva separación
    estará obligado a cumplir las obligaciones contraídas con la sociedad cooperativa de
    segundo grado o a resarcirla económicamente, si así lo decide el consejo rector de esta.
    Asimismo, salvo previsión estatutaria en contra, la entidad separada deberá continuar
    desarrollando, durante un plazo no inferior a dos años, aquellos compromisos adquiridos
    que hubiera asumido con anterioridad a la fecha de la baja.

    Artículo 132. Régimen económico.


    Las aportaciones obligatorias al capital social de una sociedad cooperativa de
    segundo grado se realizarán en función de la actividad cooperativizada comprometida
    con aquella por cada socio.

    Artículo 133. Órganos sociales.


    1. La asamblea general estará formada po...
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            1024,
            768
        ],
        "matryoshka_weights": [
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Evaluation Dataset

boe_sintetic_question_context

  • Dataset: boe_sintetic_question_context at 2391ba7
  • Size: 5,036 evaluation samples
  • Columns: question and context
  • Approximate statistics based on the first 1000 samples:
    question context
    type string string
    details
    • min: 4 tokens
    • mean: 27.32 tokens
    • max: 64 tokens
    • min: 20 tokens
    • mean: 269.89 tokens
    • max: 787 tokens
  • Samples:
    question context
    ¿Qué tipo de productos están excluidos de la aplicación del Real Decreto 1801/2003, de 26 de diciembre, sobre seguridad general de los productos? 1801/2003, de 26
    de diciembre, sobre seguridad general de los productos,
    para aquellos productos afectados por este real decreto, a
    excepción de los productos de renovación del acabado de
    vehículos.
    b) Las previstas en la Ley 21/1992, de 16 de julio, de
    Industria, para los productos de renovación del acabado
    de vehículos afectados por este real decreto.

    2. Los productos objeto de este real decreto serán
    considerados seguros cuando cumplan, además de los
    requisitos que les sean exigibles por la legislación vigente,
    lo dispuesto en este real decreto.


    Artículo 6. Información al Ministerio de Medio
    Ambiente.

    Las comunidades autónomas remitirán al Ministerio de
    Medio Ambiente un informe que contenga los resultados
    de las medidas del programa de control al que se refiere el
    artículo 5 y una relación de las categorías y cantidades de
    producto para cuya compraventa hayan concedido permisos, según lo dispuesto en la disposición adicional
    segunda, a efectos de su comunicación a l...
    ¿En qué artículo de la Constitución se basa el Estado para dictar la legislación procesal mencionada en el texto? tencia estatal.

    Esta Ley Orgánica se dicta en ejercicio de las competencias atribuidas al Estado en materia de legislación
    procesal por el artículo 149.1.6.ª de la Constitución.


    Disposición final segunda. Entrada en vigor.

    La presente Ley Orgánica entrará en vigor el día
    siguiente al de su publicación en el «Boletín Oficial del
    Estado».

    Por tanto,
    Mando a todos los españoles, particulares y autoridades, que guarden y hagan guardar esta Ley Orgánica.

    Madrid, 5 de junio de 2006.

    JUAN CARLOS R.

    El Presidente del Gobierno,

    JOSÉ LUIS RODRÍGUEZ ZAPATERO

    ### 9958 LEY 17/2006, de 5 de junio, de la radio y la tele_visión de titularidad estatal.


    JUAN CARLOS I

    REY DE ESPAÑA

    A todos los que la presente vieren y entendieren.
    Sabed: Que las Cortes Generales han aprobado y Yo
    vengo en sancionar la siguiente Ley.

    EXPOSICIÓN DE MOTIVOS

    La Constitución en su artículo 20 garantiza valores de
    pluralismo, veracidad y accesibilidad con el fin de contribuir a la formación de una opinión pú...
    ¿Cuál es el propósito principal de la Comisión Mixta establecida en el Artículo 30? Organismos de Enlace de ambas Partes intercambiarán los datos estadísticos relativos a los pagos de
    prestaciones efectuados a los beneficiarios de una Parte
    que residan en el territorio de la otra Parte. Dichos datos
    contendrán el número de beneficiarios y el importe total
    de las prestaciones abonadas durante cada año civil.
    2. Las Autoridades y los Organismos de Enlace de
    ambas Partes estarán obligados a facilitar, cuando les
    sean requeridos por la otra Parte, toda la información y
    datos sobre los sistemas de cálculo de los costes de las
    prestaciones sanitarias.

    Artículo 30. Comisión Mixta.

    Con el fin de resolver cuantos problemas puedan surgir en aplicación del Convenio y el presente Acuerdo
    Administrativo, así como para el seguimiento de los mismos, las Autoridades Competentes de ambas Partes
    podrán reunirse en Comisión Mixta, asistidas por representantes de sus respectivas Instituciones Competentes.

    Artículo 31. Pago de prestaciones.

    Las prestaciones que, conforme a la leg...
  • Loss: MatryoshkaLoss with these parameters:
    {
        "loss": "MultipleNegativesRankingLoss",
        "matryoshka_dims": [
            1024,
            768
        ],
        "matryoshka_weights": [
            1,
            1
        ],
        "n_dims_per_step": -1
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • gradient_accumulation_steps: 16
  • learning_rate: 2e-05
  • num_train_epochs: 8
  • lr_scheduler_type: cosine
  • warmup_ratio: 0.1
  • bf16: True
  • tf32: True
  • dataloader_num_workers: 4
  • load_best_model_at_end: True
  • optim: adamw_torch_fused
  • gradient_checkpointing: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 16
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 8
  • max_steps: -1
  • lr_scheduler_type: cosine
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: True
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 4
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: True
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: True
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss dim_1024_cosine_ndcg@10 dim_768_cosine_ndcg@10
1.4366 25 0.2174 - - -
2.8732 50 0.0428 - - -
4.3380 75 0.0167 - - -
5.7746 100 0.0095 0.125 0.6089 0.5994
7.2394 125 0.0073 - - -
  • The bold row denotes the saved checkpoint.

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.3.0
  • Transformers: 4.46.2
  • PyTorch: 2.2.2
  • Accelerate: 1.1.1
  • Datasets: 3.1.0
  • Tokenizers: 0.20.3

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning},
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}