louisbrulenaudet
commited on
Commit
•
14cff4d
1
Parent(s):
e47276d
Update README.md
Browse files
README.md
CHANGED
@@ -312,15 +312,20 @@ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [i
|
|
312 |
|
313 |
## Model Details
|
314 |
|
|
|
315 |
### Model Description
|
316 |
- **Model Type:** Sentence Transformer
|
317 |
- **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision ab10c1a7f42e74530fe7ae5be82e6d4f11a719eb -->
|
318 |
- **Maximum Sequence Length:** 512 tokens
|
319 |
- **Output Dimensionality:** 1024 tokens
|
320 |
- **Similarity Function:** Cosine Similarity
|
321 |
-
|
322 |
-
|
323 |
-
|
|
|
|
|
|
|
|
|
324 |
|
325 |
### Model Sources
|
326 |
|
@@ -460,13 +465,7 @@ You can finetune this model on your own dataset.
|
|
460 |
| | query | positive | negative |
|
461 |
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
462 |
| type | string | string | string |
|
463 |
-
| details | <ul><li>min: 24 tokens</li><li>mean: 54.2 tokens</li><li>max: 179 tokens</li></ul> | <ul><li>min: 75 tokens</li><li>mean: 182.28 tokens</li><li>max: 332 tokens</li></ul> | <ul><li>min: 53 tokens</li><li>mean: 190.2 tokens</li><li>max: 456 tokens</li></ul> |
|
464 |
-
* Samples:
|
465 |
-
| query | positive | negative |
|
466 |
-
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
467 |
-
| <code>query: Détaillez les conditions requises pour la déductibilité fiscale de la provision pour reconstitution des gisements de substances minérales solides selon l'article 39 du CGI.</code> | <code>passage: Pour qu'une provision pour reconstitution des gisements de substances minérales solides soit admise en déduction des bases de l'impôt sur le revenu ou de l'impôt sur les sociétés, elle doit répondre à plusieurs exigences. D'une part, la provision doit avoir été effectivement constatée en accord avec les modalités détaillées dans le 5° du 1 de l'article 39 du Code général des impôts. D'autre part, elle doit impérativement être inscrite dans le tableau ou sur le relevé des provisions mentionnés aux II et III de l'article 38 de l'annexe III au CGI. Ce document, essentiel pour le processus déclaratif, doit être joint à la déclaration des résultats de l'exercice concerné, conformément aux instructions délivrées dans le BOI-BIC-PROV-20-20.</code> | <code>passage: Conformément aux dispositions de l'article 39 ter du Code général des impôts (CGI) et de l'article 10 E de l'annexe III au CGI, les travaux effectués et les immobilisations ou participations acquises grâce à la provision pour reconstitution des gisements d'hydrocarbures sont enregistrés à leur prix de revient. Ils influent sur la détermination du bénéfice imposable selon les conditions de droit commun. Les charges d'exploitation que représentent les travaux de recherche ou de récupération sont inscrites au débit du compte de résultat de l'exercice lors duquel elles sont engagées. Les immobilisations se voient appliquer des amortissements déterminés sur la base de leur prix de revient, qui peut être réévalué, répartis sur leur durée normale d'utilisation. En cas de dépréciation ou de risque de non-recouvrement des participations comptabilisées au prix de revient, y compris des avances correspondantes, la constitution de provisions pour dépréciation est envisageable.</code> |
|
468 |
-
| <code>query: Détaillez les conditions requises pour la déductibilité fiscale de la provision pour reconstitution des gisements de substances minérales solides selon l'article 39 du CGI.</code> | <code>passage: Pour qu'une provision pour reconstitution des gisements de substances minérales solides soit admise en déduction des bases de l'impôt sur le revenu ou de l'impôt sur les sociétés, elle doit répondre à plusieurs exigences. D'une part, la provision doit avoir été effectivement constatée en accord avec les modalités détaillées dans le 5° du 1 de l'article 39 du Code général des impôts. D'autre part, elle doit impérativement être inscrite dans le tableau ou sur le relevé des provisions mentionnés aux II et III de l'article 38 de l'annexe III au CGI. Ce document, essentiel pour le processus déclaratif, doit être joint à la déclaration des résultats de l'exercice concerné, conformément aux instructions délivrées dans le BOI-BIC-PROV-20-20.</code> | <code>passage: Selon l'article 10 C quinquies de l'annexe III du Code général des impôts, les entreprises engagées dans le secteur extractif et confrontées à un déficit issu de la commercialisation de produits minéraux, qu'ils soient extraits de gisements locaux ou acquis auprès d'entités étrangères, sont autorisées à déduire ce déficit du bénéfice de l'année fiscale suivante associé aux mêmes activités. Dans le cas où le bénéfice de l'exercice s'avère insuffisant pour permettre une compensation totale du déficit, le surplus de ce dernier est alors reporté sur les bénéfices des années suivantes, jusqu'à extinction complète du déficit. Cette réglementation ne concerne que les résultats spécifiques aux opérations pour lesquelles une provision pour la reconstitution de gisements a été constituée, excluant ainsi d'autres types de bénéfices générés par l'entreprise. Cela prévoit une gestion fiscale plus équilibrée en tenant compte des variations économiques pouvant impacter le secteur extractif.</code> |
|
469 |
-
| <code>query: Détaillez les conditions requises pour la déductibilité fiscale de la provision pour reconstitution des gisements de substances minérales solides selon l'article 39 du CGI.</code> | <code>passage: Pour qu'une provision pour reconstitution des gisements de substances minérales solides soit admise en déduction des bases de l'impôt sur le revenu ou de l'impôt sur les sociétés, elle doit répondre à plusieurs exigences. D'une part, la provision doit avoir été effectivement constatée en accord avec les modalités détaillées dans le 5° du 1 de l'article 39 du Code général des impôts. D'autre part, elle doit impérativement être inscrite dans le tableau ou sur le relevé des provisions mentionnés aux II et III de l'article 38 de l'annexe III au CGI. Ce document, essentiel pour le processus déclaratif, doit être joint à la déclaration des résultats de l'exercice concerné, conformément aux instructions délivrées dans le BOI-BIC-PROV-20-20.</code> | <code>passage: Une entreprise peut être autorisée à constituer une provision pour la reconstitution des gisements miniers même si le produit marchand extrait comprend, seulement à titre accessoire, une ou plusieurs des substances minérales solidess énumérées par le Bulletin officiel des finances publiques-impôts. Cette permissivité s'applique dans le respect de certaines limites et à condition que le produit extrait ne contienne pas majoritairement des substances autres que celles désignées explicitement dans la liste limitative des substances présentant un intérêt pour l'économie française.</code> |
|
470 |
* Loss: [<code>CachedGISTEmbedLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedgistembedloss) with these parameters:
|
471 |
```json
|
472 |
{'guide': SentenceTransformer(
|
@@ -604,57 +603,6 @@ You can finetune this model on your own dataset.
|
|
604 |
|
605 |
</details>
|
606 |
|
607 |
-
### Training Logs
|
608 |
-
| Epoch | Step | Training Loss | Lemone-information-retrieval_cosine_map@100 |
|
609 |
-
|:------:|:----:|:-------------:|:-------------------------------------------:|
|
610 |
-
| 0.0432 | 100 | - | 0.9831 |
|
611 |
-
| 0.0864 | 200 | 0.6176 | 0.9829 |
|
612 |
-
| 0.1296 | 300 | - | 0.9829 |
|
613 |
-
| 0.1728 | 400 | 0.0039 | 0.9834 |
|
614 |
-
| 0.2160 | 500 | - | 0.9794 |
|
615 |
-
| 0.2592 | 600 | 0.0025 | 0.9812 |
|
616 |
-
| 0.3024 | 700 | - | 0.9850 |
|
617 |
-
| 0.3456 | 800 | 0.003 | 0.9848 |
|
618 |
-
| 0.3888 | 900 | - | 0.9844 |
|
619 |
-
| 0.4320 | 1000 | 0.003 | 0.9813 |
|
620 |
-
| 0.4752 | 1100 | - | 0.9799 |
|
621 |
-
| 0.5184 | 1200 | 0.004 | 0.9781 |
|
622 |
-
| 0.5616 | 1300 | - | 0.9814 |
|
623 |
-
| 0.6048 | 1400 | 0.0029 | 0.9830 |
|
624 |
-
| 0.6479 | 1500 | - | 0.9827 |
|
625 |
-
| 0.6911 | 1600 | 0.0017 | 0.9821 |
|
626 |
-
| 0.7343 | 1700 | - | 0.9838 |
|
627 |
-
| 0.7775 | 1800 | 0.0023 | 0.9851 |
|
628 |
-
| 0.8207 | 1900 | - | 0.9844 |
|
629 |
-
| 0.8639 | 2000 | 0.0034 | 0.9861 |
|
630 |
-
| 0.9071 | 2100 | - | 0.9846 |
|
631 |
-
| 0.9503 | 2200 | 0.0037 | 0.9839 |
|
632 |
-
| 0.9935 | 2300 | - | 0.9828 |
|
633 |
-
| 1.0350 | 2400 | 0.0017 | 0.9829 |
|
634 |
-
| 1.0782 | 2500 | - | 0.9830 |
|
635 |
-
| 1.1214 | 2600 | 0.0005 | 0.9827 |
|
636 |
-
| 1.1646 | 2700 | - | 0.9843 |
|
637 |
-
| 1.2078 | 2800 | 0.0004 | 0.9831 |
|
638 |
-
| 1.2510 | 2900 | - | 0.9838 |
|
639 |
-
| 1.2942 | 3000 | 0.0003 | 0.9846 |
|
640 |
-
| 1.3374 | 3100 | - | 0.9840 |
|
641 |
-
| 1.3806 | 3200 | 0.0001 | 0.9849 |
|
642 |
-
| 1.4238 | 3300 | - | 0.9840 |
|
643 |
-
| 1.4670 | 3400 | 0.0005 | 0.9819 |
|
644 |
-
| 1.5102 | 3500 | - | 0.9833 |
|
645 |
-
| 1.5533 | 3600 | 0.0006 | 0.9833 |
|
646 |
-
| 1.5965 | 3700 | - | 0.9837 |
|
647 |
-
| 1.6397 | 3800 | 0.0007 | 0.9839 |
|
648 |
-
| 1.6829 | 3900 | - | 0.9840 |
|
649 |
-
| 1.7261 | 4000 | 0.0001 | 0.9843 |
|
650 |
-
| 1.7693 | 4100 | - | 0.9847 |
|
651 |
-
| 1.8125 | 4200 | 0.0003 | 0.9848 |
|
652 |
-
| 1.8557 | 4300 | - | 0.9845 |
|
653 |
-
| 1.8989 | 4400 | 0.0003 | 0.9845 |
|
654 |
-
| 1.9421 | 4500 | - | 0.9848 |
|
655 |
-
| 1.9853 | 4600 | 0.0001 | 0.9848 |
|
656 |
-
|
657 |
-
|
658 |
### Environmental Impact
|
659 |
Carbon emissions were measured using [CodeCarbon](https://github.com/mlco2/codecarbon).
|
660 |
- **Energy Consumed**: 3.451 kWh
|
|
|
312 |
|
313 |
## Model Details
|
314 |
|
315 |
+
|
316 |
### Model Description
|
317 |
- **Model Type:** Sentence Transformer
|
318 |
- **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision ab10c1a7f42e74530fe7ae5be82e6d4f11a719eb -->
|
319 |
- **Maximum Sequence Length:** 512 tokens
|
320 |
- **Output Dimensionality:** 1024 tokens
|
321 |
- **Similarity Function:** Cosine Similarity
|
322 |
+
- **Developed by:** Louis Brulé Naudet
|
323 |
+
- **Funded by [optional]:** Microsoft for Startups
|
324 |
+
- **Shared by [optional]:** Louis Brulé Naudet
|
325 |
+
- **Model type:** Sentence Transformers
|
326 |
+
- **Language(s) (NLP):** FR
|
327 |
+
- **License:** Apache 2
|
328 |
+
- **Finetuned from model [optional]:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision ab10c1a7f42e74530fe7ae5be82e6d4f11a719eb -->
|
329 |
|
330 |
### Model Sources
|
331 |
|
|
|
465 |
| | query | positive | negative |
|
466 |
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------|
|
467 |
| type | string | string | string |
|
468 |
+
| details | <ul><li>min: 24 tokens</li><li>mean: 54.2 tokens</li><li>max: 179 tokens</li></ul> | <ul><li>min: 75 tokens</li><li>mean: 182.28 tokens</li><li>max: 332 tokens</li></ul> | <ul><li>min: 53 tokens</li><li>mean: 190.2 tokens</li><li>max: 456 tokens</li></ul> | |
|
|
|
|
|
|
|
|
|
|
|
|
|
469 |
* Loss: [<code>CachedGISTEmbedLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedgistembedloss) with these parameters:
|
470 |
```json
|
471 |
{'guide': SentenceTransformer(
|
|
|
603 |
|
604 |
</details>
|
605 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
606 |
### Environmental Impact
|
607 |
Carbon emissions were measured using [CodeCarbon](https://github.com/mlco2/codecarbon).
|
608 |
- **Energy Consumed**: 3.451 kWh
|