fanyak commited on
Commit
94feba2
·
verified ·
1 Parent(s): 5e28a94

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
2_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 768,
3
+ "out_features": 3072,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
2_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:c0e3c37e78af8074c17fd2b1fc49c294b2b8960a857e904d766293389e7b7998
3
+ size 9437272
3_Dense/config.json ADDED
@@ -0,0 +1,6 @@
 
 
 
 
 
 
 
1
+ {
2
+ "in_features": 3072,
3
+ "out_features": 768,
4
+ "bias": false,
5
+ "activation_function": "torch.nn.modules.linear.Identity"
6
+ }
3_Dense/model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6bf1bfc8cc80f4b6ae5ce121a0b6d537ac5b19aa28021268471faae294fbf8d4
3
+ size 9437272
README.md ADDED
@@ -0,0 +1,679 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - el
4
+ license: apache-2.0
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - dense
10
+ - generated_from_trainer
11
+ - dataset_size:535
12
+ - loss:CachedMultipleNegativesRankingLoss
13
+ base_model: google/embeddinggemma-300m
14
+ widget:
15
+ - source_sentence: "Ποιοι είναι υπόχρεοι υποβολής δήλωσης απόδοσης φόρου των έκτακτω\
16
+ \ ν αμοιβών και \nποσοστών ( bonus ) πέραν των μισθών των ναυτιλιακών εταιρειών\
17
+ \ του άρθρου 25 του ν. \n27/1975;"
18
+ sentences:
19
+ - "Σε περίπτωση που για τη δωρεά ή τη γονική παροχή συντάσσεται συμβολαιογραφικό\
20
+ \ έγγραφο, η \nδήλωση υποβάλλεται πριν από την κατάρτιση του συμβολαίου. Όταν\
21
+ \ δεν συντάσσεται συμβόλαιο, \nη δήλωση υποβάλλεται μέσα σε έξι (6) μήνες από\
22
+ \ την παράδοση του αντικειμένου της δωρεάς ή \nτης γονικής παροχής (άρθρο 86\
23
+ \ ν. 2961/2001). "
24
+ - Ως έδρα του υπό ίδρυση φυσικού προσώπου ορίζεται η διεύθυνση της κατοικίας του
25
+ ιδρυτή. Εναλλακτικά, μπορεί να οριστεί η έδρα της επιχειρηματικής δραστηριότητας
26
+ του ιδρυτή, είτε πρόκειται για φυσικό ή νομικό πρόσωπο, είτε για νομική οντότητα
27
+ αντίστοιχα.
28
+ - "Υπόχρεοι σε υποβολή δήλωσης απόδοσης του φόρου δέκα τοις εκατό (10%) με βάση\
29
+ \ τις διατάξεις \nτης παραγράφου 5 του άρθρου 43 του ν. 4111/2013 είναι οι πιο\
30
+ \ κάτω δικαιούχοι: \nα) μέλη του Δ.Σ . ή Διευθυντές και στελέχη για έκτακτες\
31
+ \ αμοιβές και ποσοστά (bonus) επιπλέον των \nμισθών που λαμβάνουν από αλλοδαπές\
32
+ \ επιχειρήσεις της περ. α΄ της παρ. 5 του άρθρου 43 του ν. \n4111/2013 από το\
33
+ \ έτος 2012 και μετά, \nβ) υπάλληλοι για έκτακτες αμοιβές και ποσοστά (bonus)\
34
+ \ επιπλέον των μισθών που λαμβάνουν \nαπό αλλοδαπές επιχειρήσεις της περ. α΄ της\
35
+ \ παρ. 5 του ίδιου άρθρου και νόμου από το έτος 2019 \nκαι μετά, \nγ) μέλη του\
36
+ \ Δ.Σ . ή Διευθυντές, στελέχη και υπάλληλοι για έκτακτες αμοιβές και ποσοστά\
37
+ \ (bonus) \nεπιπλέον των μισθών, που λαμβάνουν από ημεδαπές επιχειρήσεις της περ.\
38
+ \ β΄ της παρ. 5 του ίδιου \nάρθρου και νόμου από το έτος 2019 και μετά και \n\
39
+ δ) μέλη του Δ.Σ . ή Διευθυντές, στελέχη και υπάλληλοι για έκτακτες αμοιβές και\
40
+ \ ποσοστά (bonus) \nεπιπλέον των μισθών που λαμβάνουν από διαχειρίστριες εταιρείες\
41
+ \ ή επιχειρήσεις εγκατεστημένες \nστην Ελλάδα σύμφωνα με το άρθρο 25 του ν. 27/1975\
42
+ \ από το έτος 2019 και μετά. "
43
+ - source_sentence: "Τι ισχύει σχετικά με την θέση του οχήματος σε ακινησία ηλεκτρονικά,\
44
+ \ χωρίς \nπροσέλευση στην Δ.Ο.Υ.;"
45
+ sentences:
46
+ - 'Κάθε επιχείρηση μπορεί να εκπληρώσει την υποχρέωση αυτή επιλέγοντας είτε:
47
+
48
+ • υπηρεσίες Παρόχου Ηλεκτρονικής Έκδοσης Στοιχείων,
49
+
50
+ • τη δωρεάν εφαρμογή της ΑΑΔΕ, timologio και τη δωρεάν εφαρμογή για
51
+
52
+ κινητές συσκευές myDATAapp, οι οποίες προσφέρουν ισοδύναμη λύση και
53
+
54
+ καλύπτουν, χωρίς κόστος, και τις περιπτώσεις έκδοσης ηλεκτρονικών
55
+
56
+ τιμολογίων που αφορούν σε δημόσιες συμβάσεις'
57
+ - "Η δήλωση φόρου δωρεάς -γονικής παροχής υποβάλλεται στη Δ. Ο.Υ. της φορολογίας\
58
+ \ εισοδήματος του υπόχρεου σε φόρο \nδωρεοδόχου/τέκνου και σε περίπτωση που αρμόδιο\
59
+ \ για την παραλαβή της δήλωσης φορολογίας \nεισοδήματος είναι το ��Ε.ΦΟ.Δ.Ε. Αττικής\
60
+ \ ή Θεσσαλονίκης, υποβάλλεται στα ΚΕ.ΦΟ.Κ. Αττικής \nκαι Θεσσαλονίκης, αντίστοιχα.\
61
+ \ Αν ο δωρεοδόχος ή το τέκνο κατοικ εί στο εξωτερικό ή έχει την έδρα του στο\
62
+ \ εξωτερικό , αρμόδιο \nείναι το ΚΕ.ΦΟ.Κ. Αττικής (Δ.ΟΡΓ.Α 1065199 ΕΞ 2022/20\
63
+ \ -07-2022 Απόφαση, όπως ισχύει)."
64
+ - "Με τις διατάξεις της παρ. 2 του άρθρου 62 του δέκατου βιβλίου του ν. 5177/2025\
65
+ \ (Α΄ 21), η θέση \nτων ΕΙΧ οχημάτων και μοτοσυκλετών σε ακινησία υποβάλλεται\
66
+ \ ηλεκτρονικά χωρίς προσέλευση \nστην Δ.Ο.Υ και παράδοση των σ τοιχείων κυκλοφορίας\
67
+ \ (άδεια και πινακίδες κυκλοφορίας) με την \nπροϋπόθεση ότι αυτά: α) δεν βρίσκονται\
68
+ \ ήδη σε ακινησία στην Δ.Ο.Υ. ή σε άλλη αρχή, και β) τα \nστοιχεία κυκλοφορίας\
69
+ \ του οχήματος βρίσκονται στην κατοχή των ιδιοκτητών τους. \nΚατ΄ εφαρμογή των\
70
+ \ ως ά νω διατάξεων, η ακινησία δηλώνεται ηλεκτρονικά μέσω της Ενιαίας \nΨηφιακής\
71
+ \ Πύλης της Δημόσιας Διοίκησης (gov.gr -ΕΨΠ), ο ιδιοκτήτης ή κάτοχος αφαιρεί τα\
72
+ \ στοιχεία \nκυκλοφορίας από το όχημά του και τα φυλάσσει με ευθύνη του, ενώ το\
73
+ \ όχημα φυλάσσεται επίσης \nμε ευθ ύνη του ιδιοκτήτη/κατόχου σε κλειστό και περιφραγμένο\
74
+ \ χώρο ο οποίος δηλώνεται \nηλεκτρονικά. \nΤο αίτημα άρσης της ακινησίας, εφόσον\
75
+ \ η ακινησία είχε δηλωθεί ηλεκτρονικά, δηλώνεται επίσης \nηλεκτρονικά μέσω της\
76
+ \ Ενιαίας Ψηφιακής Πύλης της Δημόσιας Διοίκησης (gov.g r-ΕΨΠ), με την καταβολή\
77
+ \ των τελών κυκλοφορίας του έτους της άρσης και την επιβεβαίωση ύπαρξης, κατά\
78
+ \ τον \nχρόνο της άρσης, έγκυρου ασφαλιστικού συμβολαίου."
79
+ - source_sentence: "Πότε πρέπει να υποβάλει δήλωση έναρξης εργασιών φυσικό πρόσωπο\
80
+ \ - \nΔιαχειριστής εάν αποκτά τρίτο ΑΜΑ (εξαιρουμένης της περίπτωσης απόκτησης\
81
+ \ \nτρίτου ΑΜΑ για την περίπτωση της από κοινού μίσθωσης δύο δωματίων που \nήδη\
82
+ \ έχουν λάβει διαφορετικούς );"
83
+ sentences:
84
+ - Η απόφαση Ε.2132/08-07-2019 αφορά την παροχή οδηγιών για την ορθή εφαρμογή της
85
+ ΠΟΛ.1006/2013. Αυτές οι οδηγίες δίνονται μετά την τροποποίησή της με τις διατάξεις
86
+ της Α.1164/2019 απόφασης του Διοικητή της ΑΑΔΕ.
87
+ - Υπεύθυνη δήλωση από τον φορολογικό εκπρόσωπο απαιτείται για την αποδοχή του ορισμού
88
+ του. Αυτό συμβαίνει εφόσον την αίτηση απόδοσης ΑΦΜ και Κλειδαρίθμου δεν την υποβάλλει
89
+ ο ίδιος ο φορολογικός εκπρόσωπος. Η δήλωση αυτή πρέπει να έχει βεβαιωμένο το γνήσιο
90
+ της υπογραφής.
91
+ - "Τα φυσικά πρόσωπα θα πρέπει να υποβάλουν αίτημα έναρξης εργασιών εντός τριάντα\
92
+ \ \n(30) ημερών από τη λήψη του τρίτου ΑΜΑ (εξαιρουμένης της περίπτωσης απόκτησης\
93
+ \ \nτρίτου ΑΜΑ για την περίπτωση της από κοινού μίσθωσης δύο δωματίων που ήδη\
94
+ \ \nέχουν λάβει διαφορετικούς ) εκτός αν για άλλο λόγο υπήρχε υποχρέωση για έναρξη\
95
+ \ \nεργασιών σε προγενέστερο χρόνο ή εάν τα ακίνητα εκμισθώνονται επιπλωμένα και\
96
+ \ με \nάλλες παροχές πλην της παροχής κλινοσκεπασμάτων."
97
+ - source_sentence: "Ποιες αντικειμενικές δαπάνες λαμβάνονται υπόψη για τον προσδιορισμό\
98
+ \ της συνολικής \nετήσιας δαπάνης του φορολογουμένου;"
99
+ sentences:
100
+ - "Μια τέτοια λύση δεν δημιουργεί πρόβλημα αρκεί να γίνει σωστός διαχωρισμός των\
101
+ \ \nποσών (ώστε να αποφευχθεί λάθος καταβολή ή διπλή φο ρολόγηση) και τα ποσά\
102
+ \ να \nαποδοθούν με τα προβλεπόμενα έντυπα."
103
+ - Η δήλωση αυτή υποβάλλεται μέσω ηλεκτρονικού ταχυδρομείου στο ΚΕΦΟΔΕ Αττικής, στην
104
+ διεύθυνση doyaathinon@1836.syzefxis.gov.gr. Οι εν λόγω υποκείμενοι υποχρεούνται
105
+ να υποβάλλουν την παραπάνω δήλωση πριν τη διενέργεια οποιωνδήποτε φορολογητέων
106
+ πράξεων στην Ελλάδα. Ως δικαιολογητικό απαιτείται η συμπληρωμένη δήλωση έναρξης
107
+ εργασιών κοινοτικών υποκειμένων χωρίς εγκατάσταση στην Ελλάδα (Declaration of
108
+ commencement of activity for taxable persons without establishment in Greece).
109
+ - "Οι αντικειμενικές δαπάνες που λαμβάνονται υπόψη για τον προσδιορισμό της συνολικής\
110
+ \ \nετήσιας δαπάνης του φορολογουμένου είναι:\n- Ιδιοκατοικούμενες ή μισθωμένες\
111
+ \ ή δωρεάν παραχωρούμενες κύριες κατοικίες, καθώς και \nιδιοκατοικούμενες ή μισθωμέν\
112
+ \ ες δευτερεύουσες κατοικίες των βοηθητικών χώρων αυτών καθώς \nκαι των ιδιόκτητων\
113
+ \ ή μισθωμένων αυτοτελών ή δωρεάν παραχωρούμενων βοηθητικών χώρων, \n- Δαπάνες\
114
+ \ επιβατικών αυτοκινήτων Ι.Χ., αυτοκινήτων μικτής χρήσης και αυτοκινήτων τύπου\
115
+ \ \nJEEP , \n- Δαπάνη ιδιωτικών σ χολείων στοιχειώδους και μέσης εκπαίδευσης,\
116
+ \ \n- Δαπάνη οικιακών βοηθών (πέραν του ενός), οδηγών αυτοκινήτου, δασκάλων κλπ.,\
117
+ \ \n- Δαπάνες σκαφών αναψυχής ιδιωτικής χρήσης, \n- Δαπάνες αεροσκαφών, ελικοπτέρων,\
118
+ \ ανεμόπτερων, \n- Δαπάνες δεξαμενών κολύμβησης (εσωτερικές και εξωτερικές).\
119
+ \ \nΕπίσης, στις παραπάνω αντικειμενικές δαπάνες προστίθεται και ένα ποσόν ως\
120
+ \ ελάχιστη \nαντικειμενική δαπάνη διαβίωσης, το οποίο ορίζεται στο ποσό των τριών\
121
+ \ χιλιάδων ευρώ (3.000), \nπροκειμένου για άγαμο, διαζευγμένο ή χήρο και στο ποσό\
122
+ \ των πέντε χιλ ιάδων ευρώ (5.000), \nπροκειμένου για συζύγους που υποβάλλουν\
123
+ \ κοινή δήλωση, εφόσον δηλώνεται πραγματικό ή \nτεκμαρτό εισόδημα. \nΣημειώνεται\
124
+ \ ότι οι αντικειμενικές δαπάνες και υπηρεσίες του άρθρου 31 του ΚΦΕ δεν εφαρμόζονται\
125
+ \ \nγια φυσικά πρόσωπα που έχουν τη φορολο γική κατοικία τους στην αλλοδαπή, \
126
+ \ ανεξαρτήτως αν \nαποκτούν εισόδημα στην Ελλάδα, ενώ εφαρμόζονται οι διατάξεις\
127
+ \ απόκτησης περιουσιακών \nστοιχείων του άρθρου 32 του ΚΦΕ για τους κατοίκους\
128
+ \ αλλοδαπής μόνο στην περίπτωση που \nαποκτάται εισόδημα στην Ελλάδα. \nΑκόμη\
129
+ \ , η ετήσια αντικειμενική δαπάνη και η δαπάνη απόκτησης περιουσιακών στοιχείων\
130
+ \ δεν \nεφαρμόζονται προκειμένου για αγορά επιβατικού αυτοκινήτου ιδιωτικής χρήσης,\
131
+ \ οχήματος τύπου \nL, μοτοποδηλάτου, μοτοσυκλέτας, καθώς και οχήματος παντός εδάφους\
132
+ \ ή άλλου μικρού οχ ήματος \nμε τρεις ή τέσσερεις τροχούς, μηδενικών ρύπων με\
133
+ \ Λιανική Τιμή Προ Φόρων (Λ.Τ.Π.Φ.) έως \nπενήντα χιλιάδες (50.000) ευρώ. Για\
134
+ \ τα αυτοκίνητα του προηγούμενου εδαφίου ορίζεται μηδενική \nετήσια αντικειμενική\
135
+ \ δαπάνη, ενώ για τα άνω του ορίου αυτού η ετήσια αντικειμενική δαπάνη \nορίζεται\
136
+ \ σε τέσσερις χιλιάδες (4.000) ευρώ (άρθρο 33 περ. θ’ του ΚΦΕ). Η αγορά των ως\
137
+ \ άνω \nοχημάτων με ΛΤΠΦ άνω των 50.000 ευρώ δεν εμπίπτει στις διατάξεις του άρθρου\
138
+ \ 33 του ΚΦΕ και \nκατ’ επέκταση υπάγεται στις διατάξεις του άρθρου 32 το υ ΚΦΕ\
139
+ \ ολόκληρο το ποσό που \nκαταβλήθηκε για την αγορά ενός αυτοκινήτου της συγκεκριμένης\
140
+ \ κατηγορίας. Δεν επιβάλλεται στα \nαυτοκίνητα αυτά φόρος πολυτελούς διαβίωσης.\
141
+ \ \nΕπιπλέον, για φυσικά πρόσωπα που υπάγονται στις διατάξεις του άρθρου 5Γ,\
142
+ \ δεν εφαρμόζεται η \nετήσια αντικειμενική δαπάνη, η οποία προκύπτει βάσει\
143
+ \ κατοικίας (κύριας και δευτερευουσών) \nή/και επιβατικών αυτοκινήτων ιδιωτικής\
144
+ \ χρήσης (ανεξαρτήτως αριθμού οχημάτων) (Ε. 2029/2022, \nΑΔΑ: 69ΩΡ46ΜΠ3Ζ -ΨΨ4\
145
+ \ εγκύκλιος)."
146
+ - source_sentence: Πού υποβάλλεται η δήλωση φόρου κληρονομιάς;
147
+ sentences:
148
+ - Δύο εγκύκλιοι του ΓΓΔΕ ασχολούνται με τη χορήγηση ΑΦΜ σε αλλοδαπούς, καλύπτοντας
149
+ διαφορετικές κατηγορίες. Η εγκύκλιος ΠΟΛ 1230/08-10-2013 αφορά τη χορήγηση ΑΦΜ
150
+ σε αλλοδαπούς, υπηκόους τρίτων χωρών, οι οποίοι είναι κάτοχοι δελτίου αιτήσαντος
151
+ άσυλο αλλοδαπού ή δελτίου αιτούντος διεθνή προστασία. Επίσης, η εγκύκλιος ΠΟΛ
152
+ 1250/25-11-2013 ρυθμίζει τη χορήγηση ΑΦΜ σε αλλοδαπά φυσικά πρόσωπα, υπηκόους
153
+ τρίτων χωρών, που αντικειμενικά στερούνται διαβατηρίου.
154
+ - "Η δήλωση φόρου κληρονομιάς υποβάλλεται στη Δ.Ο.Υ., στην χωρική αρμοδιότητα της\
155
+ \ οποίας \nανήκει η τελευταία διεύθυνση κατοικίας του κληρονομουμένου, όπως αυτή\
156
+ \ έχει δηλωθεί στο \nΜητρώο του και σε περίπτωση που η ως άνω διεύθυνση κατοικίας\
157
+ \ βρίσκεται στην χωρική αρμοδιότητα των ΚΕ.ΦΟ.Δ.Ε. Αττικής κα ι Θεσσαλονίκης,\
158
+ \ υποβάλλεται στα ΚΕ.ΦΟ.Κ. Αττικής και \nΘεσσαλονίκης, αντίστοιχα. \nΑν ο κληρονομούμενος\
159
+ \ κατοικούσε στο εξωτερικό, η δήλωση υποβάλλεται στ o KE.ΦΟ.Κ. Αττικής \n(Δ.ΟΡΓ.Α\
160
+ \ 1065199 ΕΞ 2022/20 -7-2022 Απόφαση - Β΄ 3886, ΑΔΑ: ΨΒΛΕ46ΜΠ3Ζ -Ε6Λ, όπως \n\
161
+ ίσχυει ι)."
162
+ - Εάν κατά την είσοδο στις ψηφιακές υπηρεσίες με τους κωδικούς TAXISnet δεν επιτρέπεται
163
+ η υποβολή αιτήματος λόγω προβλήματος στα στοιχεία Μητρώου, εμφανίζεται ένα ενημερωτικό
164
+ μήνυμα. Αυτό το μήνυμα ενημερώνει τον φορολογούμενο ότι πρέπει να εξυπηρετηθεί
165
+ με αυτοπρόσωπη παρουσία από την αρμόδια Υπηρεσία.
166
+ pipeline_tag: sentence-similarity
167
+ library_name: sentence-transformers
168
+ metrics:
169
+ - cosine_accuracy@1
170
+ - cosine_accuracy@3
171
+ - cosine_accuracy@5
172
+ - cosine_accuracy@10
173
+ - cosine_precision@1
174
+ - cosine_precision@3
175
+ - cosine_precision@5
176
+ - cosine_precision@10
177
+ - cosine_recall@1
178
+ - cosine_recall@3
179
+ - cosine_recall@5
180
+ - cosine_recall@10
181
+ - cosine_ndcg@10
182
+ - cosine_mrr@10
183
+ - cosine_map@100
184
+ model-index:
185
+ - name: EmbeddingGemma-300m trained on greek public tax information
186
+ results:
187
+ - task:
188
+ type: information-retrieval
189
+ name: Information Retrieval
190
+ dataset:
191
+ name: aade eval 60q 80d v2
192
+ type: aade-eval-60q-80d-v2
193
+ metrics:
194
+ - type: cosine_accuracy@1
195
+ value: 0.8333333333333334
196
+ name: Cosine Accuracy@1
197
+ - type: cosine_accuracy@3
198
+ value: 0.9
199
+ name: Cosine Accuracy@3
200
+ - type: cosine_accuracy@5
201
+ value: 0.9166666666666666
202
+ name: Cosine Accuracy@5
203
+ - type: cosine_accuracy@10
204
+ value: 0.95
205
+ name: Cosine Accuracy@10
206
+ - type: cosine_precision@1
207
+ value: 0.8333333333333334
208
+ name: Cosine Precision@1
209
+ - type: cosine_precision@3
210
+ value: 0.29999999999999993
211
+ name: Cosine Precision@3
212
+ - type: cosine_precision@5
213
+ value: 0.18333333333333326
214
+ name: Cosine Precision@5
215
+ - type: cosine_precision@10
216
+ value: 0.09499999999999999
217
+ name: Cosine Precision@10
218
+ - type: cosine_recall@1
219
+ value: 0.8333333333333334
220
+ name: Cosine Recall@1
221
+ - type: cosine_recall@3
222
+ value: 0.9
223
+ name: Cosine Recall@3
224
+ - type: cosine_recall@5
225
+ value: 0.9166666666666666
226
+ name: Cosine Recall@5
227
+ - type: cosine_recall@10
228
+ value: 0.95
229
+ name: Cosine Recall@10
230
+ - type: cosine_ndcg@10
231
+ value: 0.8922646698833969
232
+ name: Cosine Ndcg@10
233
+ - type: cosine_mrr@10
234
+ value: 0.873611111111111
235
+ name: Cosine Mrr@10
236
+ - type: cosine_map@100
237
+ value: 0.8764903846153846
238
+ name: Cosine Map@100
239
+ - task:
240
+ type: information-retrieval
241
+ name: Information Retrieval
242
+ dataset:
243
+ name: miriad test 60 150
244
+ type: miriad-test-60-150
245
+ metrics:
246
+ - type: cosine_accuracy@1
247
+ value: 0.8322147651006712
248
+ name: Cosine Accuracy@1
249
+ - type: cosine_accuracy@3
250
+ value: 0.9463087248322147
251
+ name: Cosine Accuracy@3
252
+ - type: cosine_accuracy@5
253
+ value: 0.9731543624161074
254
+ name: Cosine Accuracy@5
255
+ - type: cosine_accuracy@10
256
+ value: 0.9731543624161074
257
+ name: Cosine Accuracy@10
258
+ - type: cosine_precision@1
259
+ value: 0.8322147651006712
260
+ name: Cosine Precision@1
261
+ - type: cosine_precision@3
262
+ value: 0.3154362416107382
263
+ name: Cosine Precision@3
264
+ - type: cosine_precision@5
265
+ value: 0.19463087248322142
266
+ name: Cosine Precision@5
267
+ - type: cosine_precision@10
268
+ value: 0.09731543624161071
269
+ name: Cosine Precision@10
270
+ - type: cosine_recall@1
271
+ value: 0.8322147651006712
272
+ name: Cosine Recall@1
273
+ - type: cosine_recall@3
274
+ value: 0.9463087248322147
275
+ name: Cosine Recall@3
276
+ - type: cosine_recall@5
277
+ value: 0.9731543624161074
278
+ name: Cosine Recall@5
279
+ - type: cosine_recall@10
280
+ value: 0.9731543624161074
281
+ name: Cosine Recall@10
282
+ - type: cosine_ndcg@10
283
+ value: 0.9128315371238599
284
+ name: Cosine Ndcg@10
285
+ - type: cosine_mrr@10
286
+ value: 0.8922818791946308
287
+ name: Cosine Mrr@10
288
+ - type: cosine_map@100
289
+ value: 0.8935630746408482
290
+ name: Cosine Map@100
291
+ ---
292
+
293
+ # EmbeddingGemma-300m trained on greek public tax information
294
+
295
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
296
+
297
+ ## Model Details
298
+
299
+ ### Model Description
300
+ - **Model Type:** Sentence Transformer
301
+ - **Base model:** [google/embeddinggemma-300m](https://huggingface.co/google/embeddinggemma-300m) <!-- at revision c5cfa06e5e282a820e85d57f7fb053207494f41d -->
302
+ - **Maximum Sequence Length:** 2048 tokens
303
+ - **Output Dimensionality:** 768 dimensions
304
+ - **Similarity Function:** Cosine Similarity
305
+ <!-- - **Training Dataset:** Unknown -->
306
+ - **Language:** el
307
+ - **License:** apache-2.0
308
+
309
+ ### Model Sources
310
+
311
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
312
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
313
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
314
+
315
+ ### Full Model Architecture
316
+
317
+ ```
318
+ SentenceTransformer(
319
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False, 'architecture': 'Gemma3TextModel'})
320
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
321
+ (2): Dense({'in_features': 768, 'out_features': 3072, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
322
+ (3): Dense({'in_features': 3072, 'out_features': 768, 'bias': False, 'activation_function': 'torch.nn.modules.linear.Identity'})
323
+ (4): Normalize()
324
+ )
325
+ ```
326
+
327
+ ## Usage
328
+
329
+ ### Direct Usage (Sentence Transformers)
330
+
331
+ First install the Sentence Transformers library:
332
+
333
+ ```bash
334
+ pip install -U sentence-transformers
335
+ ```
336
+
337
+ Then you can load this model and run inference.
338
+ ```python
339
+ from sentence_transformers import SentenceTransformer
340
+
341
+ # Download from the 🤗 Hub
342
+ model = SentenceTransformer("fanyak/embeddinggemma-300m-aade-346")
343
+ # Run inference
344
+ queries = [
345
+ "\u03a0\u03bf\u03cd \u03c5\u03c0\u03bf\u03b2\u03ac\u03bb\u03bb\u03b5\u03c4\u03b1\u03b9 \u03b7 \u03b4\u03ae\u03bb\u03c9\u03c3\u03b7 \u03c6\u03cc\u03c1\u03bf\u03c5 \u03ba\u03bb\u03b7\u03c1\u03bf\u03bd\u03bf\u03bc\u03b9\u03ac\u03c2;",
346
+ ]
347
+ documents = [
348
+ 'Η δήλωση φόρου κληρονομιάς υποβάλλεται στη Δ.Ο.Υ., στην χωρική αρμοδιότητα της οποίας \nανήκει η τελευταία διεύθυνση κατοικίας του κληρονομουμένου, όπως αυτή έχει δηλωθεί στο \nΜητρώο του και σε περίπτωση που η ως άνω διεύθυνση κατοικίας βρίσκεται στην χωρική αρμοδιότητα των ΚΕ.ΦΟ.Δ.Ε. Αττικής κα ι Θεσσαλονίκης, υποβάλλεται στα ΚΕ.ΦΟ.Κ. Αττικής και \nΘεσσαλονίκης, αντίστοιχα. \nΑν ο κληρονομούμενος κατοικούσε στο εξωτερικό, η δήλωση υποβάλλεται στ o KE.ΦΟ.Κ. Αττικής \n(Δ.ΟΡΓ.Α 1065199 ΕΞ 2022/20 -7-2022 Απόφαση - Β΄ 3886, ΑΔΑ: ΨΒΛΕ46ΜΠ3Ζ -Ε6Λ, όπως \nίσχυει ι).',
349
+ 'Εάν κατά την είσοδο στις ψηφιακές υπηρεσίες με τους κωδικούς TAXISnet δεν επιτρέπεται η υποβολή αιτήματος λόγω προβλήματος στα στοιχεία Μητρώου, εμφανίζεται ένα ενημερωτικό μήνυμα. Αυτό το μήνυμα ενημερώνει τον φορολογούμενο ότι πρέπει να εξυπηρετηθεί με αυτοπρόσωπη παρουσία από την αρμόδια Υπηρεσία.',
350
+ 'Δύο εγκύκλιοι του ΓΓΔΕ ασχολούνται με τη χορήγηση ΑΦΜ σε αλλοδαπούς, καλύπτοντας διαφορετικές κατηγορίες. Η εγκύκλιος ΠΟΛ 1230/08-10-2013 αφορά τη χορήγηση ΑΦΜ σε αλλοδαπούς, υπηκόους τρίτων χωρών, οι οποίοι είναι κάτοχοι δελτίου αιτήσαντος άσυλο αλλοδαπού ή δελτίου αιτούντος διεθνή προστασία. Επίσης, η εγκύκλιος ΠΟΛ 1250/25-11-2013 ρυθμίζει τη χορήγηση ΑΦΜ σε αλλοδαπά φυσικά πρόσωπα, υπηκόους τρίτων χωρών, που αντικειμενικά στερούνται διαβατηρίου.',
351
+ ]
352
+ query_embeddings = model.encode_query(queries)
353
+ document_embeddings = model.encode_document(documents)
354
+ print(query_embeddings.shape, document_embeddings.shape)
355
+ # [1, 768] [3, 768]
356
+
357
+ # Get the similarity scores for the embeddings
358
+ similarities = model.similarity(query_embeddings, document_embeddings)
359
+ print(similarities)
360
+ # tensor([[ 0.7931, 0.0623, -0.0191]])
361
+ ```
362
+
363
+ <!--
364
+ ### Direct Usage (Transformers)
365
+
366
+ <details><summary>Click to see the direct usage in Transformers</summary>
367
+
368
+ </details>
369
+ -->
370
+
371
+ <!--
372
+ ### Downstream Usage (Sentence Transformers)
373
+
374
+ You can finetune this model on your own dataset.
375
+
376
+ <details><summary>Click to expand</summary>
377
+
378
+ </details>
379
+ -->
380
+
381
+ <!--
382
+ ### Out-of-Scope Use
383
+
384
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
385
+ -->
386
+
387
+ ## Evaluation
388
+
389
+ ### Metrics
390
+
391
+ #### Information Retrieval
392
+
393
+ * Datasets: `aade-eval-60q-80d-v2` and `miriad-test-60-150`
394
+ * Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
395
+
396
+ | Metric | aade-eval-60q-80d-v2 | miriad-test-60-150 |
397
+ |:--------------------|:---------------------|:-------------------|
398
+ | cosine_accuracy@1 | 0.8333 | 0.8322 |
399
+ | cosine_accuracy@3 | 0.9 | 0.9463 |
400
+ | cosine_accuracy@5 | 0.9167 | 0.9732 |
401
+ | cosine_accuracy@10 | 0.95 | 0.9732 |
402
+ | cosine_precision@1 | 0.8333 | 0.8322 |
403
+ | cosine_precision@3 | 0.3 | 0.3154 |
404
+ | cosine_precision@5 | 0.1833 | 0.1946 |
405
+ | cosine_precision@10 | 0.095 | 0.0973 |
406
+ | cosine_recall@1 | 0.8333 | 0.8322 |
407
+ | cosine_recall@3 | 0.9 | 0.9463 |
408
+ | cosine_recall@5 | 0.9167 | 0.9732 |
409
+ | cosine_recall@10 | 0.95 | 0.9732 |
410
+ | **cosine_ndcg@10** | **0.8923** | **0.9128** |
411
+ | cosine_mrr@10 | 0.8736 | 0.8923 |
412
+ | cosine_map@100 | 0.8765 | 0.8936 |
413
+
414
+ <!--
415
+ ## Bias, Risks and Limitations
416
+
417
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
418
+ -->
419
+
420
+ <!--
421
+ ### Recommendations
422
+
423
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
424
+ -->
425
+
426
+ ## Training Details
427
+
428
+ ### Training Dataset
429
+
430
+ #### Unnamed Dataset
431
+
432
+ * Size: 535 training samples
433
+ * Columns: <code>Ερώτηση</code> and <code>Απάντηση</code>
434
+ * Approximate statistics based on the first 535 samples:
435
+ | | Ερώτηση | Απάντηση |
436
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
437
+ | type | string | string |
438
+ | details | <ul><li>min: 3 tokens</li><li>mean: 46.07 tokens</li><li>max: 265 tokens</li></ul> | <ul><li>min: 3 tokens</li><li>mean: 291.45 tokens</li><li>max: 2048 tokens</li></ul> |
439
+ * Samples:
440
+ | Ερώτηση | Απάντηση |
441
+ |:----------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
442
+ | <code>Πώς συμβάλλουν η απλούστευση και η ψηφιοποίηση των διαδικασιών στη βελτίωση των υπηρεσιών της ΑΑΔΕ;</code> | <code>Η απλούστευση και ψηφιοποίηση των διαδικασιών συμβάλλει στη βελτίωση του χρόνου εξυπηρέτησης πολιτών και επιχειρήσεων. Παράλληλα, οδηγεί στη μείωση της φυσικής παρουσίας και επικοινωνίας των φορολογουμένων με τις Υπηρεσίες, καθώς και στη μείωση του διοικητικού βάρους που καλούνται να επωμιστούν όλοι οι εμπλεκόμενοι.</code> |
443
+ | <code>Τα γεωργικά εισοδήματα συμπληρώνονται και στο Ε3;</code> | <code>Από το φορολογικό έτος 2014 και μετά, κατά την υποβολή των δηλώσεων φορολογίας <br>εισοδήματος, για όσους δηλώσουν εισόδημα από αγροτική επιχειρηματική δραστηριότητα, είναι <br>απαραίτητη η συμπλήρωση του εντύπου Ε3 (Πίνακας ΣΤ’), ανεξάρτητα από το αν υπάρχει <br>απαλλαγή ή όχι από την τήρηση βιβλίων των Ε.Λ.Π. και από την ένταξή τους ή όχι στο ειδικό ή στο <br>κανονικό καθεστώς Φ.Π.Α. Το αποτέλεσμα του καθαρού εισοδήματος από άσκηση ατομ ικής <br>αγροτικής δραστηριότητας, όπως αυτό προκύπτει στο έντυπο Ε3, μεταφέρεται στο έντυπο Ε1, <br>στον Πίνακα Γ1 Εισόδημα από Αγροτική Επιχειρηματική Δραστηριότητα. <br>Διευκρινίζεται ότι η ΕΠΙΛΟΓΗ 1 ΣΤΟΝ ΚΩΔ. 009 του εντύπου Ε3, συμπληρώνεται για τις αγροτικές <br>επιχειρήσεις τις υπαγόμενες στο κανονικό καθεστώς Φ.Π.Α. Η ΕΠΙΛΟΓΗ 2 για το ειδικό καθεστώς <br>Φ.Π.Α. (άρθρο 41 του ν. 2859/2000 – Α΄248) και η ΕΠΙΛΟΓΗ 3 για το αφανές καθεστώς αγροτών <br>(χωρίς ΚΑΔ).</code> |
444
+ | <code>Ποια βήματα ακολουθεί ένα τρίτο εξουσιοδοτημένο πρόσωπο για την υποβολή αίτησης εγγραφής και παραλαβής Κλειδαρίθμου;</code> | <code>Στην περίπτωση υποβολής της αίτησης εγγραφής και παραλαβής Κλειδαρίθμου από τρίτο εξουσιοδοτημένο από το νόμιμο εκπρόσωπο πρόσωπο, το τρίτο πρόσωπο εισέρχεται στην εφαρμογή με τη χρήση των προσωπικών του κωδικών πρόσβασης. Αρχικά, συμπληρώνει τον ΑΦΜ του μη φυσικού προσώπου για το οποίο ενεργεί και ανακτά τα στοιχεία του. Στη συνέχεια, επισυνάπτει τη σχετική εξουσιοδότηση και υποβάλλει την αίτηση.</code> |
445
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
446
+ ```json
447
+ {
448
+ "scale": 20.0,
449
+ "similarity_fct": "cos_sim",
450
+ "mini_batch_size": 8,
451
+ "gather_across_devices": false
452
+ }
453
+ ```
454
+
455
+ ### Evaluation Dataset
456
+
457
+ #### Unnamed Dataset
458
+
459
+ * Size: 60 evaluation samples
460
+ * Columns: <code>Ερώτηση</code> and <code>Απάντηση</code>
461
+ * Approximate statistics based on the first 60 samples:
462
+ | | Ερώτηση | Απάντηση |
463
+ |:--------|:------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
464
+ | type | string | string |
465
+ | details | <ul><li>min: 19 tokens</li><li>mean: 42.45 tokens</li><li>max: 110 tokens</li></ul> | <ul><li>min: 20 tokens</li><li>mean: 298.7 tokens</li><li>max: 1388 tokens</li></ul> |
466
+ * Samples:
467
+ | Ερώτηση | Απάντηση |
468
+ |:---------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
469
+ | <code>Πότε απαιτείται υπεύθυνη δήλωση από τον φορολογικό εκπρόσωπο;</code> | <code>Υπεύθυνη δήλωση από τον φορολογικό εκπρόσωπο απαιτείται για την αποδοχή του ορισμού του. Αυτό συμβαίνει εφόσον την αίτηση απόδοσης ΑΦΜ και Κλειδαρίθμου δεν την υποβάλλει ο ίδιος ο φορολογικός εκπρόσωπος. Η δήλωση αυτή πρέπει να έχει βεβαιωμένο το γνήσιο της υπογραφής.</code> |
470
+ | <code>Ποιες αντικειμενικές δαπάνες λαμβάνονται υπόψη για τον προσδιορισμό της συνολικής <br>ετήσιας δαπάνης του φορολογουμένου;</code> | <code>Οι αντικειμενικές δαπάνες που λαμβάνονται υπόψη για τον προσδιορισμό της συνολικής <br>ετήσιας δαπάνης του φορολογουμένου είναι:<br>- Ιδιοκατοικούμενες ή μισθωμένες ή δωρεάν παραχωρούμενες κύριες κατοικίες, καθώς και <br>ιδιοκατοικούμενες ή μισθωμέν ες δευτερεύουσες κατοικίες των βοηθητικών χώρων αυτών καθώς <br>και των ιδιόκτητων ή μισθωμένων αυτοτελών ή δωρεάν παραχωρούμενων βοηθητικών χώρων, <br>- Δαπάνες επιβατικών αυτοκινήτων Ι.Χ., αυτοκινήτων μικτής χρήσης και αυτοκινήτων τύπου <br>JEEP , <br>- Δαπάνη ιδιωτικών σ χολείων στοιχειώδους και μέσης εκπαίδευσης, <br>- Δαπάνη οικιακών βοηθών (πέραν του ενός), οδηγών αυτοκινήτου, δασκάλων κλπ., <br>- Δαπάνες σκαφών αναψυχής ιδιωτικής χρήσης, <br>- Δαπάνες αεροσκαφών, ελικοπτέρων, ανεμόπτερων, <br>- Δαπάνες δεξαμενών κολύμβησης (εσωτερικές και εξωτερικές). <br>Επίσης, στις παραπάνω αντικειμενικές δαπάνες προστίθεται και ένα ποσόν ως ελάχιστη <br>αντικειμενική δαπάνη διαβίωσης, το οποίο ορίζεται στο ποσό των τριών χιλιάδων ευρώ (3.000), <br>προκειμένου για άγαμο, διαζευγμέ...</code> |
471
+ | <code>Πού ορίζεται η έδρα ενός υπό ίδρυση ��υσικού προσώπου και ποιες είναι οι εναλλακτικές επιλογές;</code> | <code>Ως έδρα του υπό ίδρυση φυσικού προσώπου ορίζεται η διεύθυνση της κατοικίας του ιδρυτή. Εναλλακτικά, μπορεί να οριστεί η έδρα της επιχειρηματικής δραστηριότητας του ιδρυτή, είτε πρόκειται για φυσικό ή νομικό πρόσωπο, είτε για νομική οντότητα αντίστοιχα.</code> |
472
+ * Loss: [<code>CachedMultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cachedmultiplenegativesrankingloss) with these parameters:
473
+ ```json
474
+ {
475
+ "scale": 20.0,
476
+ "similarity_fct": "cos_sim",
477
+ "mini_batch_size": 8,
478
+ "gather_across_devices": false
479
+ }
480
+ ```
481
+
482
+ ### Training Hyperparameters
483
+ #### Non-Default Hyperparameters
484
+
485
+ - `eval_strategy`: steps
486
+ - `per_device_train_batch_size`: 60
487
+ - `per_device_eval_batch_size`: 60
488
+ - `learning_rate`: 2e-05
489
+ - `num_train_epochs`: 1
490
+ - `warmup_ratio`: 0.1
491
+ - `fp16`: True
492
+ - `prompts`: {'Ερώτηση': 'task: search result | query: ', 'Απάντηση': 'title: none | text: '}
493
+ - `batch_sampler`: no_duplicates
494
+
495
+ #### All Hyperparameters
496
+ <details><summary>Click to expand</summary>
497
+
498
+ - `overwrite_output_dir`: False
499
+ - `do_predict`: False
500
+ - `eval_strategy`: steps
501
+ - `prediction_loss_only`: True
502
+ - `per_device_train_batch_size`: 60
503
+ - `per_device_eval_batch_size`: 60
504
+ - `per_gpu_train_batch_size`: None
505
+ - `per_gpu_eval_batch_size`: None
506
+ - `gradient_accumulation_steps`: 1
507
+ - `eval_accumulation_steps`: None
508
+ - `torch_empty_cache_steps`: None
509
+ - `learning_rate`: 2e-05
510
+ - `weight_decay`: 0.0
511
+ - `adam_beta1`: 0.9
512
+ - `adam_beta2`: 0.999
513
+ - `adam_epsilon`: 1e-08
514
+ - `max_grad_norm`: 1.0
515
+ - `num_train_epochs`: 1
516
+ - `max_steps`: -1
517
+ - `lr_scheduler_type`: linear
518
+ - `lr_scheduler_kwargs`: {}
519
+ - `warmup_ratio`: 0.1
520
+ - `warmup_steps`: 0
521
+ - `log_level`: passive
522
+ - `log_level_replica`: warning
523
+ - `log_on_each_node`: True
524
+ - `logging_nan_inf_filter`: True
525
+ - `save_safetensors`: True
526
+ - `save_on_each_node`: False
527
+ - `save_only_model`: False
528
+ - `restore_callback_states_from_checkpoint`: False
529
+ - `no_cuda`: False
530
+ - `use_cpu`: False
531
+ - `use_mps_device`: False
532
+ - `seed`: 42
533
+ - `data_seed`: None
534
+ - `jit_mode_eval`: False
535
+ - `use_ipex`: False
536
+ - `bf16`: False
537
+ - `fp16`: True
538
+ - `fp16_opt_level`: O1
539
+ - `half_precision_backend`: auto
540
+ - `bf16_full_eval`: False
541
+ - `fp16_full_eval`: False
542
+ - `tf32`: None
543
+ - `local_rank`: 0
544
+ - `ddp_backend`: None
545
+ - `tpu_num_cores`: None
546
+ - `tpu_metrics_debug`: False
547
+ - `debug`: []
548
+ - `dataloader_drop_last`: False
549
+ - `dataloader_num_workers`: 0
550
+ - `dataloader_prefetch_factor`: None
551
+ - `past_index`: -1
552
+ - `disable_tqdm`: False
553
+ - `remove_unused_columns`: True
554
+ - `label_names`: None
555
+ - `load_best_model_at_end`: False
556
+ - `ignore_data_skip`: False
557
+ - `fsdp`: []
558
+ - `fsdp_min_num_params`: 0
559
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
560
+ - `fsdp_transformer_layer_cls_to_wrap`: None
561
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
562
+ - `parallelism_config`: None
563
+ - `deepspeed`: None
564
+ - `label_smoothing_factor`: 0.0
565
+ - `optim`: adamw_torch_fused
566
+ - `optim_args`: None
567
+ - `adafactor`: False
568
+ - `group_by_length`: False
569
+ - `length_column_name`: length
570
+ - `ddp_find_unused_parameters`: None
571
+ - `ddp_bucket_cap_mb`: None
572
+ - `ddp_broadcast_buffers`: False
573
+ - `dataloader_pin_memory`: True
574
+ - `dataloader_persistent_workers`: False
575
+ - `skip_memory_metrics`: True
576
+ - `use_legacy_prediction_loop`: False
577
+ - `push_to_hub`: False
578
+ - `resume_from_checkpoint`: None
579
+ - `hub_model_id`: None
580
+ - `hub_strategy`: every_save
581
+ - `hub_private_repo`: None
582
+ - `hub_always_push`: False
583
+ - `hub_revision`: None
584
+ - `gradient_checkpointing`: False
585
+ - `gradient_checkpointing_kwargs`: None
586
+ - `include_inputs_for_metrics`: False
587
+ - `include_for_metrics`: []
588
+ - `eval_do_concat_batches`: True
589
+ - `fp16_backend`: auto
590
+ - `push_to_hub_model_id`: None
591
+ - `push_to_hub_organization`: None
592
+ - `mp_parameters`:
593
+ - `auto_find_batch_size`: False
594
+ - `full_determinism`: False
595
+ - `torchdynamo`: None
596
+ - `ray_scope`: last
597
+ - `ddp_timeout`: 1800
598
+ - `torch_compile`: False
599
+ - `torch_compile_backend`: None
600
+ - `torch_compile_mode`: None
601
+ - `include_tokens_per_second`: False
602
+ - `include_num_input_tokens_seen`: False
603
+ - `neftune_noise_alpha`: None
604
+ - `optim_target_modules`: None
605
+ - `batch_eval_metrics`: False
606
+ - `eval_on_start`: False
607
+ - `use_liger_kernel`: False
608
+ - `liger_kernel_config`: None
609
+ - `eval_use_gather_object`: False
610
+ - `average_tokens_across_devices`: False
611
+ - `prompts`: {'Ερώτηση': 'task: search result | query: ', 'Απάντηση': 'title: none | text: '}
612
+ - `batch_sampler`: no_duplicates
613
+ - `multi_dataset_batch_sampler`: proportional
614
+ - `router_mapping`: {}
615
+ - `learning_rate_mapping`: {}
616
+
617
+ </details>
618
+
619
+ ### Training Logs
620
+ | Epoch | Step | aade-eval-60q-80d-v2_cosine_ndcg@10 | miriad-test-60-150_cosine_ndcg@10 |
621
+ |:-----:|:----:|:-----------------------------------:|:---------------------------------:|
622
+ | -1 | -1 | 0.8923 | 0.9128 |
623
+
624
+
625
+ ### Framework Versions
626
+ - Python: 3.12.11
627
+ - Sentence Transformers: 5.1.0
628
+ - Transformers: 4.57.0.dev0
629
+ - PyTorch: 2.8.0+cu126
630
+ - Accelerate: 1.10.1
631
+ - Datasets: 4.0.0
632
+ - Tokenizers: 0.22.0
633
+
634
+ ## Citation
635
+
636
+ ### BibTeX
637
+
638
+ #### Sentence Transformers
639
+ ```bibtex
640
+ @inproceedings{reimers-2019-sentence-bert,
641
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
642
+ author = "Reimers, Nils and Gurevych, Iryna",
643
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
644
+ month = "11",
645
+ year = "2019",
646
+ publisher = "Association for Computational Linguistics",
647
+ url = "https://arxiv.org/abs/1908.10084",
648
+ }
649
+ ```
650
+
651
+ #### CachedMultipleNegativesRankingLoss
652
+ ```bibtex
653
+ @misc{gao2021scaling,
654
+ title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
655
+ author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
656
+ year={2021},
657
+ eprint={2101.06983},
658
+ archivePrefix={arXiv},
659
+ primaryClass={cs.LG}
660
+ }
661
+ ```
662
+
663
+ <!--
664
+ ## Glossary
665
+
666
+ *Clearly define terms in order to be accessible across audiences.*
667
+ -->
668
+
669
+ <!--
670
+ ## Model Card Authors
671
+
672
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
673
+ -->
674
+
675
+ <!--
676
+ ## Model Card Contact
677
+
678
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
679
+ -->
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "<image_soft_token>": 262144
3
+ }
config.json ADDED
@@ -0,0 +1,60 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_sliding_window_pattern": 6,
3
+ "architectures": [
4
+ "Gemma3TextModel"
5
+ ],
6
+ "attention_bias": false,
7
+ "attention_dropout": 0.0,
8
+ "attn_logit_softcapping": null,
9
+ "bos_token_id": 2,
10
+ "dtype": "float32",
11
+ "eos_token_id": 1,
12
+ "final_logit_softcapping": null,
13
+ "head_dim": 256,
14
+ "hidden_activation": "gelu_pytorch_tanh",
15
+ "hidden_size": 768,
16
+ "initializer_range": 0.02,
17
+ "intermediate_size": 1152,
18
+ "layer_types": [
19
+ "sliding_attention",
20
+ "sliding_attention",
21
+ "sliding_attention",
22
+ "sliding_attention",
23
+ "sliding_attention",
24
+ "full_attention",
25
+ "sliding_attention",
26
+ "sliding_attention",
27
+ "sliding_attention",
28
+ "sliding_attention",
29
+ "sliding_attention",
30
+ "full_attention",
31
+ "sliding_attention",
32
+ "sliding_attention",
33
+ "sliding_attention",
34
+ "sliding_attention",
35
+ "sliding_attention",
36
+ "full_attention",
37
+ "sliding_attention",
38
+ "sliding_attention",
39
+ "sliding_attention",
40
+ "sliding_attention",
41
+ "sliding_attention",
42
+ "full_attention"
43
+ ],
44
+ "max_position_embeddings": 2048,
45
+ "model_type": "gemma3_text",
46
+ "num_attention_heads": 3,
47
+ "num_hidden_layers": 24,
48
+ "num_key_value_heads": 1,
49
+ "pad_token_id": 0,
50
+ "query_pre_attn_scalar": 256,
51
+ "rms_norm_eps": 1e-06,
52
+ "rope_local_base_freq": 10000.0,
53
+ "rope_scaling": null,
54
+ "rope_theta": 1000000.0,
55
+ "sliding_window": 257,
56
+ "transformers_version": "4.57.0.dev0",
57
+ "use_bidirectional_attention": true,
58
+ "use_cache": true,
59
+ "vocab_size": 262144
60
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,26 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "model_type": "SentenceTransformer",
3
+ "__version__": {
4
+ "sentence_transformers": "5.1.0",
5
+ "transformers": "4.57.0.dev0",
6
+ "pytorch": "2.8.0+cu126"
7
+ },
8
+ "prompts": {
9
+ "query": "task: search result | query: ",
10
+ "document": "title: none | text: ",
11
+ "BitextMining": "task: search result | query: ",
12
+ "Clustering": "task: clustering | query: ",
13
+ "Classification": "task: classification | query: ",
14
+ "InstructionRetrieval": "task: code retrieval | query: ",
15
+ "MultilabelClassification": "task: classification | query: ",
16
+ "PairClassification": "task: sentence similarity | query: ",
17
+ "Reranking": "task: search result | query: ",
18
+ "Retrieval": "task: search result | query: ",
19
+ "Retrieval-query": "task: search result | query: ",
20
+ "Retrieval-document": "title: none | text: ",
21
+ "STS": "task: sentence similarity | query: ",
22
+ "Summarization": "task: summarization | query: "
23
+ },
24
+ "default_prompt_name": null,
25
+ "similarity_fn_name": "cosine"
26
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1039a8d5b7b4cac9567f2b6a79fed13cbe65229d4cb2acab9f07a739110ad77c
3
+ size 1211486072
modules.json ADDED
@@ -0,0 +1,32 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Dense",
18
+ "type": "sentence_transformers.models.Dense"
19
+ },
20
+ {
21
+ "idx": 3,
22
+ "name": "3",
23
+ "path": "3_Dense",
24
+ "type": "sentence_transformers.models.Dense"
25
+ },
26
+ {
27
+ "idx": 4,
28
+ "name": "4",
29
+ "path": "4_Normalize",
30
+ "type": "sentence_transformers.models.Normalize"
31
+ }
32
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,33 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "boi_token": "<start_of_image>",
3
+ "bos_token": {
4
+ "content": "<bos>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false
9
+ },
10
+ "eoi_token": "<end_of_image>",
11
+ "eos_token": {
12
+ "content": "<eos>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false
17
+ },
18
+ "image_token": "<image_soft_token>",
19
+ "pad_token": {
20
+ "content": "<pad>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false
25
+ },
26
+ "unk_token": {
27
+ "content": "<unk>",
28
+ "lstrip": false,
29
+ "normalized": false,
30
+ "rstrip": false,
31
+ "single_word": false
32
+ }
33
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:216e2a79606fe879c9f17c529c71cd241338407fd5646b595ffd3c4b9ea1d503
3
+ size 33385262
tokenizer.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:1299c11d7cf632ef3b4e11937501358ada021bbdf7c47638d13c0ee982f2e79c
3
+ size 4689074
tokenizer_config.json ADDED
The diff for this file is too large to render. See raw diff