Add new SentenceTransformer model
Browse files- .gitattributes +1 -0
- 1_Pooling/config.json +10 -0
- README.md +945 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +20 -0
- sentence_bert_config.json +4 -0
- sentencepiece.bpe.model +3 -0
- special_tokens_map.json +51 -0
- tokenizer.json +3 -0
- tokenizer_config.json +54 -0
.gitattributes
CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
33 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
34 |
*.zst filter=lfs diff=lfs merge=lfs -text
|
35 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
36 |
+
tokenizer.json filter=lfs diff=lfs merge=lfs -text
|
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 1024,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,945 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
base_model: intfloat/multilingual-e5-large
|
3 |
+
language:
|
4 |
+
- it
|
5 |
+
library_name: sentence-transformers
|
6 |
+
license: apache-2.0
|
7 |
+
metrics:
|
8 |
+
- cosine_accuracy@1
|
9 |
+
- cosine_accuracy@3
|
10 |
+
- cosine_accuracy@5
|
11 |
+
- cosine_accuracy@10
|
12 |
+
- cosine_precision@1
|
13 |
+
- cosine_precision@3
|
14 |
+
- cosine_precision@5
|
15 |
+
- cosine_precision@10
|
16 |
+
- cosine_recall@1
|
17 |
+
- cosine_recall@3
|
18 |
+
- cosine_recall@5
|
19 |
+
- cosine_recall@10
|
20 |
+
- cosine_ndcg@10
|
21 |
+
- cosine_mrr@10
|
22 |
+
- cosine_map@100
|
23 |
+
pipeline_tag: sentence-similarity
|
24 |
+
tags:
|
25 |
+
- sentence-transformers
|
26 |
+
- sentence-similarity
|
27 |
+
- feature-extraction
|
28 |
+
- generated_from_trainer
|
29 |
+
- dataset_size:182223
|
30 |
+
- loss:MatryoshkaLoss
|
31 |
+
- loss:MultipleNegativesRankingLoss
|
32 |
+
widget:
|
33 |
+
- source_sentence: 'Çandahar
|
34 |
+
|
35 |
+
Çandahar è un comune dell''Azerbaigian situato nel distretto di İsmayıllı. Conta
|
36 |
+
una popolazione di 155 abitanti.
|
37 |
+
|
38 |
+
|
39 |
+
Collegamenti esterni
|
40 |
+
|
41 |
+
Çandahar su GEOnet Names Server
|
42 |
+
|
43 |
+
|
44 |
+
Comuni del distretto di İsmayıllı'
|
45 |
+
sentences:
|
46 |
+
- Quali sono i principali dati demografici e territoriali dell'upazila di Lalmohan
|
47 |
+
secondo il censimento del 1991?
|
48 |
+
- Qual è la popolazione del comune di Çandahar?
|
49 |
+
- Cosa è stato associato a uno stato socioeconomico inferiore e a uno stato sociale
|
50 |
+
più elevato in relazione all'uso di alcol, sigarette e droghe ricreative durante
|
51 |
+
la gravidanza?
|
52 |
+
- source_sentence: "New Glasgow\nNew Glasgow è una municipalità (town) del Canada,\
|
53 |
+
\ situata nella provincia di Nuova Scozia.\n\nAltri progetti\n\nCollegamenti esterni\
|
54 |
+
\ \n \n\n \n\nMunicipalità della Nuova Scozia"
|
55 |
+
sentences:
|
56 |
+
- Come viene classificata la specie Pteropus rayneri dalla IUCN Red List e quali
|
57 |
+
fattori possono influire sulla sua conservazione?
|
58 |
+
- In quale paese si trova la municipalità di New Glasgow?
|
59 |
+
- Quanti motori e quanti piloti aveva il Morane-Saulnier Type TRK?
|
60 |
+
- source_sentence: 'Embolia
|
61 |
+
|
62 |
+
Lembolia (o embolismo) è l''ostruzione di un''arteria o di una vena, causata da
|
63 |
+
un corpo estraneo al normale flusso sanguigno, che viene denominato embolo e che
|
64 |
+
può essere un coagulo di sangue, una bolla d''aria o di altri gas, generalmente
|
65 |
+
azoto, o altre formazioni di dimensioni tali da ostruire un vaso arterioso o venoso.
|
66 |
+
Nei casi più gravi in cui essa interessi un''arteria, l''embolia può provocare
|
67 |
+
la morte del soggetto colpito per ischemia cerebrale, polmonare o cardiaca. Per
|
68 |
+
l''embolia da coaguli ematici, che è il tipo più frequente di embolia, vedi trombosi.
|
69 |
+
Classificazione L''embolia viene classificata sia in base all''apparato colpito
|
70 |
+
che al tipo di corpo estraneo coinvolto. A seconda del fattore coinvolto si parla
|
71 |
+
di: embolia gassosa, quando l''embolo sia causato da una bolla di gas (ad.es.:
|
72 |
+
azoto). A tale tipo di embolia è particolarmente esposto chi pratichi immersioni
|
73 |
+
subacquee; infatti, nel caso in cui non vengano rispettati i tempi di decompressione,
|
74 |
+
l''improvvisa variazione di pressione può portare alla formazione di bolle d''azoto
|
75 |
+
nel circolo sanguigno. Analogamente, la stessa cosa può succedere nel caso di
|
76 |
+
volo ad alta quota in una cabina non pressurizzata. In generale comunque, eccezion
|
77 |
+
fatta per i casi succitati, l''embolia gassosa è un evento molto raro. embolia
|
78 |
+
lipidica (chiamata anche liquida, adiposa o grassosa o sindrome lipido-embolica),
|
79 |
+
quando l''embolo è costituito da un ammasso di grasso. I lipidi infatti essendo
|
80 |
+
idrofobici e quindi insolubuli nel sangue idrofilo si dispongono a formare una
|
81 |
+
micella che può provocare l''ostruzione del vaso. Tale embolia si verifica specialmente
|
82 |
+
come effetto collaterale anche tardivo nel caso di eventi traumatici alle ossa
|
83 |
+
del bacino e agli arti inferiori. embolia da liquido amniotico, nelle donne durante
|
84 |
+
la gravidanza può accadere che del liquido amniotico venga spinto nel circolo
|
85 |
+
sanguigno materno. embolia da colesterolo, causata da placche aterosclerotiche
|
86 |
+
all''interno di un vaso sanguigno.'
|
87 |
+
sentences:
|
88 |
+
- In quale città e anno nacque Jean-Baptiste Auriol?
|
89 |
+
- Cosa suggerisce Aldo al protagonista riguardo ai dipinti del Catena e cosa succede
|
90 |
+
successivamente?
|
91 |
+
- Cosa è l'embolia gassosa?
|
92 |
+
- source_sentence: "FireHouse (album)\nFireHouse è il primo album in studio del gruppo\
|
93 |
+
\ musicale statunitense FireHouse, pubblicato il 7 settembre 1990 dalla Epic Records.\n\
|
94 |
+
\nIl disco \nL'album è stato certificato doppio disco di platino negli Stati Uniti,\
|
95 |
+
\ e disco d'oro in Canada, Giappone e Singapore.\n\nVennero estratti i quattro\
|
96 |
+
\ singoli Shake & Tumble, Don't Treat Me Bad, All She Wrote e la ballata Love\
|
97 |
+
\ of a Lifetime, diventato il brano più famoso del gruppo.\n\nLa traccia Don't\
|
98 |
+
\ Walk Away appare in una scena del film The Wrestler diretto da Darren Aronofsky\
|
99 |
+
\ nel 2008.\n\nIl brano Overnight Sensation è parte della colonna sonora del videogioco\
|
100 |
+
\ Brütal Legend.\n\nTracce\n\nFormazione\n C.J. Snare – voce, tastiere\n Bill\
|
101 |
+
\ Leverty – chitarre\n Perry Richardson – basso\n Michael Foster – batteria, percussioni\n\
|
102 |
+
\nClassifiche\n\nNote\n\nCollegamenti esterni"
|
103 |
+
sentences:
|
104 |
+
- Quando è stato pubblicato l'album FireHouse e quale disco ha ottenuto nella certificazione
|
105 |
+
degli Stati Uniti?
|
106 |
+
- Chi ha scritto la sceneggiatura del film 'Oggi a me... domani a te'?
|
107 |
+
- Chi è Marco Andreolli?
|
108 |
+
- source_sentence: 'Precipitine sieriche contro i microbi nel fieno ammuffito rispetto
|
109 |
+
all''età, al sesso, all''atopia e al fumo degli agricoltori.Questo studio si è
|
110 |
+
basato su un campione di 3.065 agricoltori su una popolazione più ampia di 12.056
|
111 |
+
agricoltori finlandesi. I dati sono stati raccolti in un''indagine postale condotta
|
112 |
+
dall''Istituto di previdenza sociale della Finlandia. Campioni di siero per la
|
113 |
+
determinazione degli anticorpi precipitanti sono stati prelevati presso i centri
|
114 |
+
sanitari locali. Le precipitazioni sono state determinate con il metodo della
|
115 |
+
micropiastra diffusione immunitaria. Il pannello dell''antigene era costituito
|
116 |
+
da antigeni miceliali di Micropolyspora faeni, Thermoactinomyces vulgaris, Aspergillus
|
117 |
+
fumigatus e Aspergillus umbrosus. Precipitine a uno qualsiasi dei quattro microbi
|
118 |
+
sono state rilevate nell''8,6% dei sieri. Le cause più comuni di test di precipitina
|
119 |
+
positivi erano Aspergillus umbrosus e Thermoactinomyces vulgaris, che concorda
|
120 |
+
con i risultati precedenti riportati dalla Finlandia In generale, le precipitine
|
121 |
+
erano più prevalenti tra le donne, il che corrisponde alle tradizioni culturali
|
122 |
+
locali e negli agricoltori più anziani. La prevalenza delle precipitine non differiva
|
123 |
+
tra i soggetti non atopici e atopici (definiti come coesistenza passata o presente
|
124 |
+
di dermatite atopica inclusi eczema infantile e/o febbre da fieno o altre riniti
|
125 |
+
allergiche). Al contrario, la prevalenza delle precipitine era circa 1,5-2 volte
|
126 |
+
maggiore tra i non fumatori rispetto ai fumatori, il che conferma i risultati
|
127 |
+
dei rapporti precedenti. Negli studi futuri sulla presenza di precipitine, i dati
|
128 |
+
dovrebbero essere controllati rispetto all''età, al sesso e al fumo. '
|
129 |
+
sentences:
|
130 |
+
- Quali sono i quattro microbi che sono stati utilizzati per la determinazione delle
|
131 |
+
precipitine nel siero degli agricoltori?
|
132 |
+
- Le strutture tricline delle proteine bovine a basso pH e ovine ad alto pH sono
|
133 |
+
simili nonostante la transizione conformazionale pH-dipendente delle proteine
|
134 |
+
bovina e suina?
|
135 |
+
- Quali due canzoni vengono eseguite dopo il monologo 'Eva e la bambola'?
|
136 |
+
model-index:
|
137 |
+
- name: ReDiX/multilingual-e5-large
|
138 |
+
results:
|
139 |
+
- task:
|
140 |
+
type: information-retrieval
|
141 |
+
name: Information Retrieval
|
142 |
+
dataset:
|
143 |
+
name: dim 1024
|
144 |
+
type: dim_1024
|
145 |
+
metrics:
|
146 |
+
- type: cosine_accuracy@1
|
147 |
+
value: 0.7948439352034768
|
148 |
+
name: Cosine Accuracy@1
|
149 |
+
- type: cosine_accuracy@3
|
150 |
+
value: 0.9205353615171868
|
151 |
+
name: Cosine Accuracy@3
|
152 |
+
- type: cosine_accuracy@5
|
153 |
+
value: 0.9347096009482418
|
154 |
+
name: Cosine Accuracy@5
|
155 |
+
- type: cosine_accuracy@10
|
156 |
+
value: 0.9473528249703674
|
157 |
+
name: Cosine Accuracy@10
|
158 |
+
- type: cosine_precision@1
|
159 |
+
value: 0.7948439352034768
|
160 |
+
name: Cosine Precision@1
|
161 |
+
- type: cosine_precision@3
|
162 |
+
value: 0.306845120505729
|
163 |
+
name: Cosine Precision@3
|
164 |
+
- type: cosine_precision@5
|
165 |
+
value: 0.1869419201896484
|
166 |
+
name: Cosine Precision@5
|
167 |
+
- type: cosine_precision@10
|
168 |
+
value: 0.09473528249703676
|
169 |
+
name: Cosine Precision@10
|
170 |
+
- type: cosine_recall@1
|
171 |
+
value: 0.7948439352034768
|
172 |
+
name: Cosine Recall@1
|
173 |
+
- type: cosine_recall@3
|
174 |
+
value: 0.9205353615171868
|
175 |
+
name: Cosine Recall@3
|
176 |
+
- type: cosine_recall@5
|
177 |
+
value: 0.9347096009482418
|
178 |
+
name: Cosine Recall@5
|
179 |
+
- type: cosine_recall@10
|
180 |
+
value: 0.9473528249703674
|
181 |
+
name: Cosine Recall@10
|
182 |
+
- type: cosine_ndcg@10
|
183 |
+
value: 0.8817864955582441
|
184 |
+
name: Cosine Ndcg@10
|
185 |
+
- type: cosine_mrr@10
|
186 |
+
value: 0.8596923348886538
|
187 |
+
name: Cosine Mrr@10
|
188 |
+
- type: cosine_map@100
|
189 |
+
value: 0.8610794523479144
|
190 |
+
name: Cosine Map@100
|
191 |
+
- task:
|
192 |
+
type: information-retrieval
|
193 |
+
name: Information Retrieval
|
194 |
+
dataset:
|
195 |
+
name: dim 768
|
196 |
+
type: dim_768
|
197 |
+
metrics:
|
198 |
+
- type: cosine_accuracy@1
|
199 |
+
value: 0.7927696562623469
|
200 |
+
name: Cosine Accuracy@1
|
201 |
+
- type: cosine_accuracy@3
|
202 |
+
value: 0.9198933227973133
|
203 |
+
name: Cosine Accuracy@3
|
204 |
+
- type: cosine_accuracy@5
|
205 |
+
value: 0.9340675622283683
|
206 |
+
name: Cosine Accuracy@5
|
207 |
+
- type: cosine_accuracy@10
|
208 |
+
value: 0.9465626234689846
|
209 |
+
name: Cosine Accuracy@10
|
210 |
+
- type: cosine_precision@1
|
211 |
+
value: 0.7927696562623469
|
212 |
+
name: Cosine Precision@1
|
213 |
+
- type: cosine_precision@3
|
214 |
+
value: 0.3066311075991044
|
215 |
+
name: Cosine Precision@3
|
216 |
+
- type: cosine_precision@5
|
217 |
+
value: 0.18681351244567365
|
218 |
+
name: Cosine Precision@5
|
219 |
+
- type: cosine_precision@10
|
220 |
+
value: 0.09465626234689846
|
221 |
+
name: Cosine Precision@10
|
222 |
+
- type: cosine_recall@1
|
223 |
+
value: 0.7927696562623469
|
224 |
+
name: Cosine Recall@1
|
225 |
+
- type: cosine_recall@3
|
226 |
+
value: 0.9198933227973133
|
227 |
+
name: Cosine Recall@3
|
228 |
+
- type: cosine_recall@5
|
229 |
+
value: 0.9340675622283683
|
230 |
+
name: Cosine Recall@5
|
231 |
+
- type: cosine_recall@10
|
232 |
+
value: 0.9465626234689846
|
233 |
+
name: Cosine Recall@10
|
234 |
+
- type: cosine_ndcg@10
|
235 |
+
value: 0.8805084163364723
|
236 |
+
name: Cosine Ndcg@10
|
237 |
+
- type: cosine_mrr@10
|
238 |
+
value: 0.8582397124858148
|
239 |
+
name: Cosine Mrr@10
|
240 |
+
- type: cosine_map@100
|
241 |
+
value: 0.8596200861512284
|
242 |
+
name: Cosine Map@100
|
243 |
+
- task:
|
244 |
+
type: information-retrieval
|
245 |
+
name: Information Retrieval
|
246 |
+
dataset:
|
247 |
+
name: dim 512
|
248 |
+
type: dim_512
|
249 |
+
metrics:
|
250 |
+
- type: cosine_accuracy@1
|
251 |
+
value: 0.7921770051363097
|
252 |
+
name: Cosine Accuracy@1
|
253 |
+
- type: cosine_accuracy@3
|
254 |
+
value: 0.9187574081390755
|
255 |
+
name: Cosine Accuracy@3
|
256 |
+
- type: cosine_accuracy@5
|
257 |
+
value: 0.9316475701303832
|
258 |
+
name: Cosine Accuracy@5
|
259 |
+
- type: cosine_accuracy@10
|
260 |
+
value: 0.9446858949032003
|
261 |
+
name: Cosine Accuracy@10
|
262 |
+
- type: cosine_precision@1
|
263 |
+
value: 0.7921770051363097
|
264 |
+
name: Cosine Precision@1
|
265 |
+
- type: cosine_precision@3
|
266 |
+
value: 0.30625246937969175
|
267 |
+
name: Cosine Precision@3
|
268 |
+
- type: cosine_precision@5
|
269 |
+
value: 0.18632951402607667
|
270 |
+
name: Cosine Precision@5
|
271 |
+
- type: cosine_precision@10
|
272 |
+
value: 0.09446858949032005
|
273 |
+
name: Cosine Precision@10
|
274 |
+
- type: cosine_recall@1
|
275 |
+
value: 0.7921770051363097
|
276 |
+
name: Cosine Recall@1
|
277 |
+
- type: cosine_recall@3
|
278 |
+
value: 0.9187574081390755
|
279 |
+
name: Cosine Recall@3
|
280 |
+
- type: cosine_recall@5
|
281 |
+
value: 0.9316475701303832
|
282 |
+
name: Cosine Recall@5
|
283 |
+
- type: cosine_recall@10
|
284 |
+
value: 0.9446858949032003
|
285 |
+
name: Cosine Recall@10
|
286 |
+
- type: cosine_ndcg@10
|
287 |
+
value: 0.8792920452275124
|
288 |
+
name: Cosine Ndcg@10
|
289 |
+
- type: cosine_mrr@10
|
290 |
+
value: 0.857240476033695
|
291 |
+
name: Cosine Mrr@10
|
292 |
+
- type: cosine_map@100
|
293 |
+
value: 0.858646487778512
|
294 |
+
name: Cosine Map@100
|
295 |
+
- task:
|
296 |
+
type: information-retrieval
|
297 |
+
name: Information Retrieval
|
298 |
+
dataset:
|
299 |
+
name: dim 256
|
300 |
+
type: dim_256
|
301 |
+
metrics:
|
302 |
+
- type: cosine_accuracy@1
|
303 |
+
value: 0.7871394705649941
|
304 |
+
name: Cosine Accuracy@1
|
305 |
+
- type: cosine_accuracy@3
|
306 |
+
value: 0.9129296720663769
|
307 |
+
name: Cosine Accuracy@3
|
308 |
+
- type: cosine_accuracy@5
|
309 |
+
value: 0.9268075859344133
|
310 |
+
name: Cosine Accuracy@5
|
311 |
+
- type: cosine_accuracy@10
|
312 |
+
value: 0.9414263137099961
|
313 |
+
name: Cosine Accuracy@10
|
314 |
+
- type: cosine_precision@1
|
315 |
+
value: 0.7871394705649941
|
316 |
+
name: Cosine Precision@1
|
317 |
+
- type: cosine_precision@3
|
318 |
+
value: 0.3043098906887923
|
319 |
+
name: Cosine Precision@3
|
320 |
+
- type: cosine_precision@5
|
321 |
+
value: 0.18536151718688268
|
322 |
+
name: Cosine Precision@5
|
323 |
+
- type: cosine_precision@10
|
324 |
+
value: 0.09414263137099962
|
325 |
+
name: Cosine Precision@10
|
326 |
+
- type: cosine_recall@1
|
327 |
+
value: 0.7871394705649941
|
328 |
+
name: Cosine Recall@1
|
329 |
+
- type: cosine_recall@3
|
330 |
+
value: 0.9129296720663769
|
331 |
+
name: Cosine Recall@3
|
332 |
+
- type: cosine_recall@5
|
333 |
+
value: 0.9268075859344133
|
334 |
+
name: Cosine Recall@5
|
335 |
+
- type: cosine_recall@10
|
336 |
+
value: 0.9414263137099961
|
337 |
+
name: Cosine Recall@10
|
338 |
+
- type: cosine_ndcg@10
|
339 |
+
value: 0.8746513367400706
|
340 |
+
name: Cosine Ndcg@10
|
341 |
+
- type: cosine_mrr@10
|
342 |
+
value: 0.8522241075740239
|
343 |
+
name: Cosine Mrr@10
|
344 |
+
- type: cosine_map@100
|
345 |
+
value: 0.8536655855801353
|
346 |
+
name: Cosine Map@100
|
347 |
+
- task:
|
348 |
+
type: information-retrieval
|
349 |
+
name: Information Retrieval
|
350 |
+
dataset:
|
351 |
+
name: dim 128
|
352 |
+
type: dim_128
|
353 |
+
metrics:
|
354 |
+
- type: cosine_accuracy@1
|
355 |
+
value: 0.777903990517582
|
356 |
+
name: Cosine Accuracy@1
|
357 |
+
- type: cosine_accuracy@3
|
358 |
+
value: 0.904632556301857
|
359 |
+
name: Cosine Accuracy@3
|
360 |
+
- type: cosine_accuracy@5
|
361 |
+
value: 0.9177696562623469
|
362 |
+
name: Cosine Accuracy@5
|
363 |
+
- type: cosine_accuracy@10
|
364 |
+
value: 0.9329316475701304
|
365 |
+
name: Cosine Accuracy@10
|
366 |
+
- type: cosine_precision@1
|
367 |
+
value: 0.777903990517582
|
368 |
+
name: Cosine Precision@1
|
369 |
+
- type: cosine_precision@3
|
370 |
+
value: 0.3015441854339523
|
371 |
+
name: Cosine Precision@3
|
372 |
+
- type: cosine_precision@5
|
373 |
+
value: 0.1835539312524694
|
374 |
+
name: Cosine Precision@5
|
375 |
+
- type: cosine_precision@10
|
376 |
+
value: 0.09329316475701306
|
377 |
+
name: Cosine Precision@10
|
378 |
+
- type: cosine_recall@1
|
379 |
+
value: 0.777903990517582
|
380 |
+
name: Cosine Recall@1
|
381 |
+
- type: cosine_recall@3
|
382 |
+
value: 0.904632556301857
|
383 |
+
name: Cosine Recall@3
|
384 |
+
- type: cosine_recall@5
|
385 |
+
value: 0.9177696562623469
|
386 |
+
name: Cosine Recall@5
|
387 |
+
- type: cosine_recall@10
|
388 |
+
value: 0.9329316475701304
|
389 |
+
name: Cosine Recall@10
|
390 |
+
- type: cosine_ndcg@10
|
391 |
+
value: 0.865788698082033
|
392 |
+
name: Cosine Ndcg@10
|
393 |
+
- type: cosine_mrr@10
|
394 |
+
value: 0.8432427384558511
|
395 |
+
name: Cosine Mrr@10
|
396 |
+
- type: cosine_map@100
|
397 |
+
value: 0.8449138896139231
|
398 |
+
name: Cosine Map@100
|
399 |
+
- task:
|
400 |
+
type: information-retrieval
|
401 |
+
name: Information Retrieval
|
402 |
+
dataset:
|
403 |
+
name: dim 64
|
404 |
+
type: dim_64
|
405 |
+
metrics:
|
406 |
+
- type: cosine_accuracy@1
|
407 |
+
value: 0.7547905966021335
|
408 |
+
name: Cosine Accuracy@1
|
409 |
+
- type: cosine_accuracy@3
|
410 |
+
value: 0.8831983405768471
|
411 |
+
name: Cosine Accuracy@3
|
412 |
+
- type: cosine_accuracy@5
|
413 |
+
value: 0.8993480837613591
|
414 |
+
name: Cosine Accuracy@5
|
415 |
+
- type: cosine_accuracy@10
|
416 |
+
value: 0.918016594231529
|
417 |
+
name: Cosine Accuracy@10
|
418 |
+
- type: cosine_precision@1
|
419 |
+
value: 0.7547905966021335
|
420 |
+
name: Cosine Precision@1
|
421 |
+
- type: cosine_precision@3
|
422 |
+
value: 0.294399446858949
|
423 |
+
name: Cosine Precision@3
|
424 |
+
- type: cosine_precision@5
|
425 |
+
value: 0.17986961675227184
|
426 |
+
name: Cosine Precision@5
|
427 |
+
- type: cosine_precision@10
|
428 |
+
value: 0.09180165942315291
|
429 |
+
name: Cosine Precision@10
|
430 |
+
- type: cosine_recall@1
|
431 |
+
value: 0.7547905966021335
|
432 |
+
name: Cosine Recall@1
|
433 |
+
- type: cosine_recall@3
|
434 |
+
value: 0.8831983405768471
|
435 |
+
name: Cosine Recall@3
|
436 |
+
- type: cosine_recall@5
|
437 |
+
value: 0.8993480837613591
|
438 |
+
name: Cosine Recall@5
|
439 |
+
- type: cosine_recall@10
|
440 |
+
value: 0.918016594231529
|
441 |
+
name: Cosine Recall@10
|
442 |
+
- type: cosine_ndcg@10
|
443 |
+
value: 0.8459093589204112
|
444 |
+
name: Cosine Ndcg@10
|
445 |
+
- type: cosine_mrr@10
|
446 |
+
value: 0.821874039685682
|
447 |
+
name: Cosine Mrr@10
|
448 |
+
- type: cosine_map@100
|
449 |
+
value: 0.8238103416018093
|
450 |
+
name: Cosine Map@100
|
451 |
+
---
|
452 |
+
|
453 |
+
# ReDiX/multilingual-e5-large
|
454 |
+
|
455 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) on the data dataset. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
456 |
+
|
457 |
+
## Model Details
|
458 |
+
|
459 |
+
### Model Description
|
460 |
+
- **Model Type:** Sentence Transformer
|
461 |
+
- **Base model:** [intfloat/multilingual-e5-large](https://huggingface.co/intfloat/multilingual-e5-large) <!-- at revision ab10c1a7f42e74530fe7ae5be82e6d4f11a719eb -->
|
462 |
+
- **Maximum Sequence Length:** 512 tokens
|
463 |
+
- **Output Dimensionality:** 1024 dimensions
|
464 |
+
- **Similarity Function:** Cosine Similarity
|
465 |
+
- **Training Dataset:**
|
466 |
+
- data
|
467 |
+
- **Language:** it
|
468 |
+
- **License:** apache-2.0
|
469 |
+
|
470 |
+
### Model Sources
|
471 |
+
|
472 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
473 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
474 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
475 |
+
|
476 |
+
### Full Model Architecture
|
477 |
+
|
478 |
+
```
|
479 |
+
SentenceTransformer(
|
480 |
+
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
|
481 |
+
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
482 |
+
(2): Normalize()
|
483 |
+
)
|
484 |
+
```
|
485 |
+
|
486 |
+
## Usage
|
487 |
+
|
488 |
+
### Direct Usage (Sentence Transformers)
|
489 |
+
|
490 |
+
First install the Sentence Transformers library:
|
491 |
+
|
492 |
+
```bash
|
493 |
+
pip install -U sentence-transformers
|
494 |
+
```
|
495 |
+
|
496 |
+
Then you can load this model and run inference.
|
497 |
+
```python
|
498 |
+
from sentence_transformers import SentenceTransformer
|
499 |
+
|
500 |
+
# Download from the 🤗 Hub
|
501 |
+
model = SentenceTransformer("mik3ml/multilingual-e5-large-ita")
|
502 |
+
# Run inference
|
503 |
+
sentences = [
|
504 |
+
"Precipitine sieriche contro i microbi nel fieno ammuffito rispetto all'età, al sesso, all'atopia e al fumo degli agricoltori.Questo studio si è basato su un campione di 3.065 agricoltori su una popolazione più ampia di 12.056 agricoltori finlandesi. I dati sono stati raccolti in un'indagine postale condotta dall'Istituto di previdenza sociale della Finlandia. Campioni di siero per la determinazione degli anticorpi precipitanti sono stati prelevati presso i centri sanitari locali. Le precipitazioni sono state determinate con il metodo della micropiastra diffusione immunitaria. Il pannello dell'antigene era costituito da antigeni miceliali di Micropolyspora faeni, Thermoactinomyces vulgaris, Aspergillus fumigatus e Aspergillus umbrosus. Precipitine a uno qualsiasi dei quattro microbi sono state rilevate nell'8,6% dei sieri. Le cause più comuni di test di precipitina positivi erano Aspergillus umbrosus e Thermoactinomyces vulgaris, che concorda con i risultati precedenti riportati dalla Finlandia In generale, le precipitine erano più prevalenti tra le donne, il che corrisponde alle tradizioni culturali locali e negli agricoltori più anziani. La prevalenza delle precipitine non differiva tra i soggetti non atopici e atopici (definiti come coesistenza passata o presente di dermatite atopica inclusi eczema infantile e/o febbre da fieno o altre riniti allergiche). Al contrario, la prevalenza delle precipitine era circa 1,5-2 volte maggiore tra i non fumatori rispetto ai fumatori, il che conferma i risultati dei rapporti precedenti. Negli studi futuri sulla presenza di precipitine, i dati dovrebbero essere controllati rispetto all'età, al sesso e al fumo. ",
|
505 |
+
'Quali sono i quattro microbi che sono stati utilizzati per la determinazione delle precipitine nel siero degli agricoltori?',
|
506 |
+
'Le strutture tricline delle proteine bovine a basso pH e ovine ad alto pH sono simili nonostante la transizione conformazionale pH-dipendente delle proteine bovina e suina?',
|
507 |
+
]
|
508 |
+
embeddings = model.encode(sentences)
|
509 |
+
print(embeddings.shape)
|
510 |
+
# [3, 1024]
|
511 |
+
|
512 |
+
# Get the similarity scores for the embeddings
|
513 |
+
similarities = model.similarity(embeddings, embeddings)
|
514 |
+
print(similarities.shape)
|
515 |
+
# [3, 3]
|
516 |
+
```
|
517 |
+
|
518 |
+
<!--
|
519 |
+
### Direct Usage (Transformers)
|
520 |
+
|
521 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
522 |
+
|
523 |
+
</details>
|
524 |
+
-->
|
525 |
+
|
526 |
+
<!--
|
527 |
+
### Downstream Usage (Sentence Transformers)
|
528 |
+
|
529 |
+
You can finetune this model on your own dataset.
|
530 |
+
|
531 |
+
<details><summary>Click to expand</summary>
|
532 |
+
|
533 |
+
</details>
|
534 |
+
-->
|
535 |
+
|
536 |
+
<!--
|
537 |
+
### Out-of-Scope Use
|
538 |
+
|
539 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
540 |
+
-->
|
541 |
+
|
542 |
+
## Evaluation
|
543 |
+
|
544 |
+
### Metrics
|
545 |
+
|
546 |
+
#### Information Retrieval
|
547 |
+
|
548 |
+
* Datasets: `dim_1024`, `dim_768`, `dim_512`, `dim_256`, `dim_128` and `dim_64`
|
549 |
+
* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)
|
550 |
+
|
551 |
+
| Metric | dim_1024 | dim_768 | dim_512 | dim_256 | dim_128 | dim_64 |
|
552 |
+
|:--------------------|:-----------|:-----------|:-----------|:-----------|:-----------|:-----------|
|
553 |
+
| cosine_accuracy@1 | 0.7948 | 0.7928 | 0.7922 | 0.7871 | 0.7779 | 0.7548 |
|
554 |
+
| cosine_accuracy@3 | 0.9205 | 0.9199 | 0.9188 | 0.9129 | 0.9046 | 0.8832 |
|
555 |
+
| cosine_accuracy@5 | 0.9347 | 0.9341 | 0.9316 | 0.9268 | 0.9178 | 0.8993 |
|
556 |
+
| cosine_accuracy@10 | 0.9474 | 0.9466 | 0.9447 | 0.9414 | 0.9329 | 0.918 |
|
557 |
+
| cosine_precision@1 | 0.7948 | 0.7928 | 0.7922 | 0.7871 | 0.7779 | 0.7548 |
|
558 |
+
| cosine_precision@3 | 0.3068 | 0.3066 | 0.3063 | 0.3043 | 0.3015 | 0.2944 |
|
559 |
+
| cosine_precision@5 | 0.1869 | 0.1868 | 0.1863 | 0.1854 | 0.1836 | 0.1799 |
|
560 |
+
| cosine_precision@10 | 0.0947 | 0.0947 | 0.0945 | 0.0941 | 0.0933 | 0.0918 |
|
561 |
+
| cosine_recall@1 | 0.7948 | 0.7928 | 0.7922 | 0.7871 | 0.7779 | 0.7548 |
|
562 |
+
| cosine_recall@3 | 0.9205 | 0.9199 | 0.9188 | 0.9129 | 0.9046 | 0.8832 |
|
563 |
+
| cosine_recall@5 | 0.9347 | 0.9341 | 0.9316 | 0.9268 | 0.9178 | 0.8993 |
|
564 |
+
| cosine_recall@10 | 0.9474 | 0.9466 | 0.9447 | 0.9414 | 0.9329 | 0.918 |
|
565 |
+
| **cosine_ndcg@10** | **0.8818** | **0.8805** | **0.8793** | **0.8747** | **0.8658** | **0.8459** |
|
566 |
+
| cosine_mrr@10 | 0.8597 | 0.8582 | 0.8572 | 0.8522 | 0.8432 | 0.8219 |
|
567 |
+
| cosine_map@100 | 0.8611 | 0.8596 | 0.8586 | 0.8537 | 0.8449 | 0.8238 |
|
568 |
+
|
569 |
+
<!--
|
570 |
+
## Bias, Risks and Limitations
|
571 |
+
|
572 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
573 |
+
-->
|
574 |
+
|
575 |
+
<!--
|
576 |
+
### Recommendations
|
577 |
+
|
578 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
579 |
+
-->
|
580 |
+
|
581 |
+
## Training Details
|
582 |
+
|
583 |
+
### Training Dataset
|
584 |
+
|
585 |
+
#### data
|
586 |
+
|
587 |
+
* Dataset: data
|
588 |
+
* Size: 182,223 training samples
|
589 |
+
* Columns: <code>positive</code> and <code>anchor</code>
|
590 |
+
* Approximate statistics based on the first 1000 samples:
|
591 |
+
| | positive | anchor |
|
592 |
+
|:--------|:-------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------|
|
593 |
+
| type | string | string |
|
594 |
+
| details | <ul><li>min: 12 tokens</li><li>mean: 416.02 tokens</li><li>max: 512 tokens</li></ul> | <ul><li>min: 7 tokens</li><li>mean: 19.33 tokens</li><li>max: 69 tokens</li></ul> |
|
595 |
+
* Samples:
|
596 |
+
| positive | anchor |
|
597 |
+
|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------|
|
598 |
+
| <code>Thomas Poulsen<br><br><br>Palmarès<br><br>Olimpiadi<br>1 medaglia:<br>1 oro ( nel 4 senza pesi leggeri)<br><br>Collegamenti esterni</code> | <code>In quale categoria ha vinto la sua unica medaglia olimpica?</code> |
|
599 |
+
| <code>Porta di Saint Denis<br>La porta di Saint Denis (porte Saint-Denis in francese) è un arco di trionfo situato nel X arrondissement di Parigi, costruito nel 1672 su progetto dall'architetto François Blondel, in onore del re Luigi XIV. <br>È uno dei monumenti più rappresentativi dell'arte ufficiale della sua epoca, secondo tutte le antologie.<br><br>Storia<br><br>Con l'espansione urbanistica di Parigi, la cinta muraria di Carlo V del XIV secolo fu sostituita da una barriera affiancata da un viale alberato (boulevard): le porte trionfali prendono, quindi, il posto di quelle fortificate del Medioevo.<br><br>La porta di Saint-Denis fu eretta nel 1672, sulla base del progetto di François Blondel, direttore dell'Accademia reale dell'architettura, e dello scultore Michel Anguier su commissione del re Luigi XIV, per celebrare le sue vittorie lungo il Reno, in Franca Contea e nei dintorni della città.<br><br>La porta fu costruita al di sopra di un bastione del secolo precedente, in sostituzione di una porta medievale, e si tr...</code> | <code>Quali elementi architettonici e decorativi sono presenti nell'arco di trionfo di Saint Denis?</code> |
|
600 |
+
| <code>Provincia di Venezia<br>La provincia di Venezia (provincia de Venesia in veneto, provincie di Vignesie in friulano) è stata una provincia italiana del Veneto, sostituita nel 2015 dall'omonima città metropolitana. Storia La provincia fu creata nel 1866, col passaggio all'Italia del Veneto in seguito alla Terza Guerra d'Indipendenza, sostituendo l'omonimo ente amministrativo austriaco. Quest'ultimo aveva a sua volta sostituito il Dipartimento dell'Adriatico napoleonico, che, a differenza delle successive suddivisioni amministrative, comprendeva anche i cantoni friulani (suddivisione amministrativa francese equivalente al mandamento) di Aquileia, Latisana e Portogruaro. Le prime elezioni provinciali si tennero il 23 dicembre 1866. Geografia fisica La provincia di Venezia era sostanzialmente una realtà eterogenea, che univa all'interno di un unico territorio più circondari: Venezia, Chioggia, Cavarzere e Cona, Riviera del Brenta, Miranese, Sandonatese, Portogruarese. La provincia confinava co...</code> | <code>Chi sostituì l'omonimo ente amministrativo austriaco?</code> |
|
601 |
+
* Loss: [<code>MatryoshkaLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters:
|
602 |
+
```json
|
603 |
+
{
|
604 |
+
"loss": "MultipleNegativesRankingLoss",
|
605 |
+
"matryoshka_dims": [
|
606 |
+
1024,
|
607 |
+
768,
|
608 |
+
512,
|
609 |
+
256,
|
610 |
+
128,
|
611 |
+
64
|
612 |
+
],
|
613 |
+
"matryoshka_weights": [
|
614 |
+
1,
|
615 |
+
1,
|
616 |
+
1,
|
617 |
+
1,
|
618 |
+
1,
|
619 |
+
1
|
620 |
+
],
|
621 |
+
"n_dims_per_step": -1
|
622 |
+
}
|
623 |
+
```
|
624 |
+
|
625 |
+
### Training Hyperparameters
|
626 |
+
#### Non-Default Hyperparameters
|
627 |
+
|
628 |
+
- `eval_strategy`: epoch
|
629 |
+
- `per_device_train_batch_size`: 32
|
630 |
+
- `per_device_eval_batch_size`: 16
|
631 |
+
- `gradient_accumulation_steps`: 16
|
632 |
+
- `learning_rate`: 2e-05
|
633 |
+
- `lr_scheduler_type`: cosine
|
634 |
+
- `warmup_ratio`: 0.1
|
635 |
+
- `bf16`: True
|
636 |
+
- `tf32`: True
|
637 |
+
- `load_best_model_at_end`: True
|
638 |
+
- `optim`: adamw_torch_fused
|
639 |
+
- `batch_sampler`: no_duplicates
|
640 |
+
|
641 |
+
#### All Hyperparameters
|
642 |
+
<details><summary>Click to expand</summary>
|
643 |
+
|
644 |
+
- `overwrite_output_dir`: False
|
645 |
+
- `do_predict`: False
|
646 |
+
- `eval_strategy`: epoch
|
647 |
+
- `prediction_loss_only`: True
|
648 |
+
- `per_device_train_batch_size`: 32
|
649 |
+
- `per_device_eval_batch_size`: 16
|
650 |
+
- `per_gpu_train_batch_size`: None
|
651 |
+
- `per_gpu_eval_batch_size`: None
|
652 |
+
- `gradient_accumulation_steps`: 16
|
653 |
+
- `eval_accumulation_steps`: None
|
654 |
+
- `torch_empty_cache_steps`: None
|
655 |
+
- `learning_rate`: 2e-05
|
656 |
+
- `weight_decay`: 0.0
|
657 |
+
- `adam_beta1`: 0.9
|
658 |
+
- `adam_beta2`: 0.999
|
659 |
+
- `adam_epsilon`: 1e-08
|
660 |
+
- `max_grad_norm`: 1.0
|
661 |
+
- `num_train_epochs`: 3
|
662 |
+
- `max_steps`: -1
|
663 |
+
- `lr_scheduler_type`: cosine
|
664 |
+
- `lr_scheduler_kwargs`: {}
|
665 |
+
- `warmup_ratio`: 0.1
|
666 |
+
- `warmup_steps`: 0
|
667 |
+
- `log_level`: passive
|
668 |
+
- `log_level_replica`: warning
|
669 |
+
- `log_on_each_node`: True
|
670 |
+
- `logging_nan_inf_filter`: True
|
671 |
+
- `save_safetensors`: True
|
672 |
+
- `save_on_each_node`: False
|
673 |
+
- `save_only_model`: False
|
674 |
+
- `restore_callback_states_from_checkpoint`: False
|
675 |
+
- `no_cuda`: False
|
676 |
+
- `use_cpu`: False
|
677 |
+
- `use_mps_device`: False
|
678 |
+
- `seed`: 42
|
679 |
+
- `data_seed`: None
|
680 |
+
- `jit_mode_eval`: False
|
681 |
+
- `use_ipex`: False
|
682 |
+
- `bf16`: True
|
683 |
+
- `fp16`: False
|
684 |
+
- `fp16_opt_level`: O1
|
685 |
+
- `half_precision_backend`: auto
|
686 |
+
- `bf16_full_eval`: False
|
687 |
+
- `fp16_full_eval`: False
|
688 |
+
- `tf32`: True
|
689 |
+
- `local_rank`: 0
|
690 |
+
- `ddp_backend`: None
|
691 |
+
- `tpu_num_cores`: None
|
692 |
+
- `tpu_metrics_debug`: False
|
693 |
+
- `debug`: []
|
694 |
+
- `dataloader_drop_last`: False
|
695 |
+
- `dataloader_num_workers`: 0
|
696 |
+
- `dataloader_prefetch_factor`: None
|
697 |
+
- `past_index`: -1
|
698 |
+
- `disable_tqdm`: False
|
699 |
+
- `remove_unused_columns`: True
|
700 |
+
- `label_names`: None
|
701 |
+
- `load_best_model_at_end`: True
|
702 |
+
- `ignore_data_skip`: False
|
703 |
+
- `fsdp`: []
|
704 |
+
- `fsdp_min_num_params`: 0
|
705 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
706 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
707 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
708 |
+
- `deepspeed`: None
|
709 |
+
- `label_smoothing_factor`: 0.0
|
710 |
+
- `optim`: adamw_torch_fused
|
711 |
+
- `optim_args`: None
|
712 |
+
- `adafactor`: False
|
713 |
+
- `group_by_length`: False
|
714 |
+
- `length_column_name`: length
|
715 |
+
- `ddp_find_unused_parameters`: None
|
716 |
+
- `ddp_bucket_cap_mb`: None
|
717 |
+
- `ddp_broadcast_buffers`: False
|
718 |
+
- `dataloader_pin_memory`: True
|
719 |
+
- `dataloader_persistent_workers`: False
|
720 |
+
- `skip_memory_metrics`: True
|
721 |
+
- `use_legacy_prediction_loop`: False
|
722 |
+
- `push_to_hub`: False
|
723 |
+
- `resume_from_checkpoint`: None
|
724 |
+
- `hub_model_id`: None
|
725 |
+
- `hub_strategy`: every_save
|
726 |
+
- `hub_private_repo`: False
|
727 |
+
- `hub_always_push`: False
|
728 |
+
- `gradient_checkpointing`: False
|
729 |
+
- `gradient_checkpointing_kwargs`: None
|
730 |
+
- `include_inputs_for_metrics`: False
|
731 |
+
- `include_for_metrics`: []
|
732 |
+
- `eval_do_concat_batches`: True
|
733 |
+
- `fp16_backend`: auto
|
734 |
+
- `push_to_hub_model_id`: None
|
735 |
+
- `push_to_hub_organization`: None
|
736 |
+
- `mp_parameters`:
|
737 |
+
- `auto_find_batch_size`: False
|
738 |
+
- `full_determinism`: False
|
739 |
+
- `torchdynamo`: None
|
740 |
+
- `ray_scope`: last
|
741 |
+
- `ddp_timeout`: 1800
|
742 |
+
- `torch_compile`: False
|
743 |
+
- `torch_compile_backend`: None
|
744 |
+
- `torch_compile_mode`: None
|
745 |
+
- `dispatch_batches`: None
|
746 |
+
- `split_batches`: None
|
747 |
+
- `include_tokens_per_second`: False
|
748 |
+
- `include_num_input_tokens_seen`: False
|
749 |
+
- `neftune_noise_alpha`: None
|
750 |
+
- `optim_target_modules`: None
|
751 |
+
- `batch_eval_metrics`: False
|
752 |
+
- `eval_on_start`: False
|
753 |
+
- `use_liger_kernel`: False
|
754 |
+
- `eval_use_gather_object`: False
|
755 |
+
- `prompts`: None
|
756 |
+
- `batch_sampler`: no_duplicates
|
757 |
+
- `multi_dataset_batch_sampler`: proportional
|
758 |
+
|
759 |
+
</details>
|
760 |
+
|
761 |
+
### Training Logs
|
762 |
+
<details><summary>Click to expand</summary>
|
763 |
+
|
764 |
+
| Epoch | Step | Training Loss | dim_1024_cosine_ndcg@10 | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
|
765 |
+
|:----------:|:-------:|:-------------:|:-----------------------:|:----------------------:|:----------------------:|:----------------------:|:----------------------:|:---------------------:|
|
766 |
+
| 0.0281 | 10 | 136.2519 | - | - | - | - | - | - |
|
767 |
+
| 0.0562 | 20 | 93.5635 | - | - | - | - | - | - |
|
768 |
+
| 0.0843 | 30 | 39.1184 | - | - | - | - | - | - |
|
769 |
+
| 0.1124 | 40 | 19.4777 | - | - | - | - | - | - |
|
770 |
+
| 0.1405 | 50 | 10.0755 | - | - | - | - | - | - |
|
771 |
+
| 0.1686 | 60 | 7.4115 | - | - | - | - | - | - |
|
772 |
+
| 0.1967 | 70 | 5.8366 | - | - | - | - | - | - |
|
773 |
+
| 0.2248 | 80 | 5.6908 | - | - | - | - | - | - |
|
774 |
+
| 0.2529 | 90 | 5.6481 | - | - | - | - | - | - |
|
775 |
+
| 0.2809 | 100 | 4.8332 | - | - | - | - | - | - |
|
776 |
+
| 0.3090 | 110 | 5.2106 | - | - | - | - | - | - |
|
777 |
+
| 0.3371 | 120 | 5.2924 | - | - | - | - | - | - |
|
778 |
+
| 0.3652 | 130 | 4.2509 | - | - | - | - | - | - |
|
779 |
+
| 0.3933 | 140 | 4.0525 | - | - | - | - | - | - |
|
780 |
+
| 0.4214 | 150 | 3.7339 | - | - | - | - | - | - |
|
781 |
+
| 0.4495 | 160 | 3.4459 | - | - | - | - | - | - |
|
782 |
+
| 0.4776 | 170 | 3.4454 | - | - | - | - | - | - |
|
783 |
+
| 0.5057 | 180 | 3.5051 | - | - | - | - | - | - |
|
784 |
+
| 0.5338 | 190 | 3.1434 | - | - | - | - | - | - |
|
785 |
+
| 0.5619 | 200 | 3.4567 | - | - | - | - | - | - |
|
786 |
+
| 0.5900 | 210 | 3.7854 | - | - | - | - | - | - |
|
787 |
+
| 0.6181 | 220 | 3.7576 | - | - | - | - | - | - |
|
788 |
+
| 0.6462 | 230 | 3.2254 | - | - | - | - | - | - |
|
789 |
+
| 0.6743 | 240 | 3.5808 | - | - | - | - | - | - |
|
790 |
+
| 0.7024 | 250 | 3.7216 | - | - | - | - | - | - |
|
791 |
+
| 0.7305 | 260 | 2.9924 | - | - | - | - | - | - |
|
792 |
+
| 0.7586 | 270 | 3.4136 | - | - | - | - | - | - |
|
793 |
+
| 0.7867 | 280 | 3.4912 | - | - | - | - | - | - |
|
794 |
+
| 0.8147 | 290 | 3.1589 | - | - | - | - | - | - |
|
795 |
+
| 0.8428 | 300 | 3.1169 | - | - | - | - | - | - |
|
796 |
+
| 0.8709 | 310 | 3.2492 | - | - | - | - | - | - |
|
797 |
+
| 0.8990 | 320 | 3.0045 | - | - | - | - | - | - |
|
798 |
+
| 0.9271 | 330 | 3.424 | - | - | - | - | - | - |
|
799 |
+
| 0.9552 | 340 | 3.0119 | - | - | - | - | - | - |
|
800 |
+
| 0.9833 | 350 | 2.8333 | - | - | - | - | - | - |
|
801 |
+
| 0.9974 | 355 | - | 0.8821 | 0.8805 | 0.8795 | 0.8720 | 0.8617 | 0.8327 |
|
802 |
+
| 1.0114 | 360 | 3.1381 | - | - | - | - | - | - |
|
803 |
+
| 1.0395 | 370 | 2.7908 | - | - | - | - | - | - |
|
804 |
+
| 1.0676 | 380 | 2.5703 | - | - | - | - | - | - |
|
805 |
+
| 1.0957 | 390 | 2.5087 | - | - | - | - | - | - |
|
806 |
+
| 1.1238 | 400 | 2.3044 | - | - | - | - | - | - |
|
807 |
+
| 1.1519 | 410 | 2.0035 | - | - | - | - | - | - |
|
808 |
+
| 1.1800 | 420 | 1.8526 | - | - | - | - | - | - |
|
809 |
+
| 1.2081 | 430 | 1.8608 | - | - | - | - | - | - |
|
810 |
+
| 1.2362 | 440 | 1.6593 | - | - | - | - | - | - |
|
811 |
+
| 1.2643 | 450 | 1.8343 | - | - | - | - | - | - |
|
812 |
+
| 1.2924 | 460 | 1.4608 | - | - | - | - | - | - |
|
813 |
+
| 1.3205 | 470 | 1.4987 | - | - | - | - | - | - |
|
814 |
+
| 1.3486 | 480 | 1.4047 | - | - | - | - | - | - |
|
815 |
+
| 1.3766 | 490 | 1.449 | - | - | - | - | - | - |
|
816 |
+
| 1.4047 | 500 | 1.2679 | - | - | - | - | - | - |
|
817 |
+
| 1.4328 | 510 | 1.3128 | - | - | - | - | - | - |
|
818 |
+
| 1.4609 | 520 | 1.1416 | - | - | - | - | - | - |
|
819 |
+
| 1.4890 | 530 | 1.1702 | - | - | - | - | - | - |
|
820 |
+
| 1.5171 | 540 | 0.875 | - | - | - | - | - | - |
|
821 |
+
| 1.5452 | 550 | 1.1781 | - | - | - | - | - | - |
|
822 |
+
| 1.5733 | 560 | 1.2128 | - | - | - | - | - | - |
|
823 |
+
| 1.6014 | 570 | 1.407 | - | - | - | - | - | - |
|
824 |
+
| 1.6295 | 580 | 1.0243 | - | - | - | - | - | - |
|
825 |
+
| 1.6576 | 590 | 1.2503 | - | - | - | - | - | - |
|
826 |
+
| 1.6857 | 600 | 1.1823 | - | - | - | - | - | - |
|
827 |
+
| 1.7138 | 610 | 0.9505 | - | - | - | - | - | - |
|
828 |
+
| 1.7419 | 620 | 1.1575 | - | - | - | - | - | - |
|
829 |
+
| 1.7700 | 630 | 1.1425 | - | - | - | - | - | - |
|
830 |
+
| 1.7981 | 640 | 1.2302 | - | - | - | - | - | - |
|
831 |
+
| 1.8262 | 650 | 1.2546 | - | - | - | - | - | - |
|
832 |
+
| 1.8543 | 660 | 1.1812 | - | - | - | - | - | - |
|
833 |
+
| 1.8824 | 670 | 1.2926 | - | - | - | - | - | - |
|
834 |
+
| 1.9104 | 680 | 1.2066 | - | - | - | - | - | - |
|
835 |
+
| 1.9385 | 690 | 1.2115 | - | - | - | - | - | - |
|
836 |
+
| 1.9666 | 700 | 1.0249 | - | - | - | - | - | - |
|
837 |
+
| 1.9947 | 710 | 1.1983 | - | - | - | - | - | - |
|
838 |
+
| **1.9975** | **711** | **-** | **0.8836** | **0.8823** | **0.8805** | **0.8752** | **0.8661** | **0.8446** |
|
839 |
+
| 2.0228 | 720 | 0.9967 | - | - | - | - | - | - |
|
840 |
+
| 2.0509 | 730 | 1.0107 | - | - | - | - | - | - |
|
841 |
+
| 2.0790 | 740 | 0.9413 | - | - | - | - | - | - |
|
842 |
+
| 2.1071 | 750 | 0.925 | - | - | - | - | - | - |
|
843 |
+
| 2.1352 | 760 | 0.5456 | - | - | - | - | - | - |
|
844 |
+
| 2.1633 | 770 | 0.6579 | - | - | - | - | - | - |
|
845 |
+
| 2.1914 | 780 | 0.6707 | - | - | - | - | - | - |
|
846 |
+
| 2.2195 | 790 | 0.6353 | - | - | - | - | - | - |
|
847 |
+
| 2.2476 | 800 | 0.5963 | - | - | - | - | - | - |
|
848 |
+
| 2.2757 | 810 | 0.6415 | - | - | - | - | - | - |
|
849 |
+
| 2.3038 | 820 | 0.5406 | - | - | - | - | - | - |
|
850 |
+
| 2.3319 | 830 | 0.6237 | - | - | - | - | - | - |
|
851 |
+
| 2.3600 | 840 | 0.624 | - | - | - | - | - | - |
|
852 |
+
| 2.3881 | 850 | 0.6492 | - | - | - | - | - | - |
|
853 |
+
| 2.4162 | 860 | 0.5391 | - | - | - | - | - | - |
|
854 |
+
| 2.4442 | 870 | 0.5127 | - | - | - | - | - | - |
|
855 |
+
| 2.4723 | 880 | 0.4845 | - | - | - | - | - | - |
|
856 |
+
| 2.5004 | 890 | 0.4985 | - | - | - | - | - | - |
|
857 |
+
| 2.5285 | 900 | 0.3705 | - | - | - | - | - | - |
|
858 |
+
| 2.5566 | 910 | 0.6361 | - | - | - | - | - | - |
|
859 |
+
| 2.5847 | 920 | 0.5917 | - | - | - | - | - | - |
|
860 |
+
| 2.6128 | 930 | 0.7143 | - | - | - | - | - | - |
|
861 |
+
| 2.6409 | 940 | 0.4301 | - | - | - | - | - | - |
|
862 |
+
| 2.6690 | 950 | 0.596 | - | - | - | - | - | - |
|
863 |
+
| 2.6971 | 960 | 0.5491 | - | - | - | - | - | - |
|
864 |
+
| 2.7252 | 970 | 0.4395 | - | - | - | - | - | - |
|
865 |
+
| 2.7533 | 980 | 0.5665 | - | - | - | - | - | - |
|
866 |
+
| 2.7814 | 990 | 0.6238 | - | - | - | - | - | - |
|
867 |
+
| 2.8095 | 1000 | 0.673 | - | - | - | - | - | - |
|
868 |
+
| 2.8376 | 1010 | 0.6221 | - | - | - | - | - | - |
|
869 |
+
| 2.8657 | 1020 | 0.8164 | - | - | - | - | - | - |
|
870 |
+
| 2.8938 | 1030 | 0.6686 | - | - | - | - | - | - |
|
871 |
+
| 2.9219 | 1040 | 0.8187 | - | - | - | - | - | - |
|
872 |
+
| 2.9500 | 1050 | 0.5303 | - | - | - | - | - | - |
|
873 |
+
| 2.9781 | 1060 | 0.6483 | - | - | - | - | - | - |
|
874 |
+
| 2.9921 | 1065 | - | 0.8818 | 0.8805 | 0.8793 | 0.8747 | 0.8658 | 0.8459 |
|
875 |
+
|
876 |
+
* The bold row denotes the saved checkpoint.
|
877 |
+
</details>
|
878 |
+
|
879 |
+
### Framework Versions
|
880 |
+
- Python: 3.10.12
|
881 |
+
- Sentence Transformers: 3.3.0
|
882 |
+
- Transformers: 4.46.1
|
883 |
+
- PyTorch: 2.5.1+cu124
|
884 |
+
- Accelerate: 1.0.1
|
885 |
+
- Datasets: 3.0.2
|
886 |
+
- Tokenizers: 0.20.0
|
887 |
+
|
888 |
+
## Citation
|
889 |
+
|
890 |
+
### BibTeX
|
891 |
+
|
892 |
+
#### Sentence Transformers
|
893 |
+
```bibtex
|
894 |
+
@inproceedings{reimers-2019-sentence-bert,
|
895 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
896 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
897 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
898 |
+
month = "11",
|
899 |
+
year = "2019",
|
900 |
+
publisher = "Association for Computational Linguistics",
|
901 |
+
url = "https://arxiv.org/abs/1908.10084",
|
902 |
+
}
|
903 |
+
```
|
904 |
+
|
905 |
+
#### MatryoshkaLoss
|
906 |
+
```bibtex
|
907 |
+
@misc{kusupati2024matryoshka,
|
908 |
+
title={Matryoshka Representation Learning},
|
909 |
+
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
|
910 |
+
year={2024},
|
911 |
+
eprint={2205.13147},
|
912 |
+
archivePrefix={arXiv},
|
913 |
+
primaryClass={cs.LG}
|
914 |
+
}
|
915 |
+
```
|
916 |
+
|
917 |
+
#### MultipleNegativesRankingLoss
|
918 |
+
```bibtex
|
919 |
+
@misc{henderson2017efficient,
|
920 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
921 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
922 |
+
year={2017},
|
923 |
+
eprint={1705.00652},
|
924 |
+
archivePrefix={arXiv},
|
925 |
+
primaryClass={cs.CL}
|
926 |
+
}
|
927 |
+
```
|
928 |
+
|
929 |
+
<!--
|
930 |
+
## Glossary
|
931 |
+
|
932 |
+
*Clearly define terms in order to be accessible across audiences.*
|
933 |
+
-->
|
934 |
+
|
935 |
+
<!--
|
936 |
+
## Model Card Authors
|
937 |
+
|
938 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
939 |
+
-->
|
940 |
+
|
941 |
+
<!--
|
942 |
+
## Model Card Contact
|
943 |
+
|
944 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
945 |
+
-->
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "intfloat/multilingual-e5-large",
|
3 |
+
"architectures": [
|
4 |
+
"XLMRobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 1024,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 4096,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 514,
|
17 |
+
"model_type": "xlm-roberta",
|
18 |
+
"num_attention_heads": 16,
|
19 |
+
"num_hidden_layers": 24,
|
20 |
+
"output_past": true,
|
21 |
+
"pad_token_id": 1,
|
22 |
+
"position_embedding_type": "absolute",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.46.1",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 250002
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.3.0",
|
4 |
+
"transformers": "4.46.1",
|
5 |
+
"pytorch": "2.5.1+cu124"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": "cosine"
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:146d634952497a362cf9d174fbe0a6c0d6b432105301ceb1fdb453ecac1d5bab
|
3 |
+
size 2239607176
|
modules.json
ADDED
@@ -0,0 +1,20 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
},
|
14 |
+
{
|
15 |
+
"idx": 2,
|
16 |
+
"name": "2",
|
17 |
+
"path": "2_Normalize",
|
18 |
+
"type": "sentence_transformers.models.Normalize"
|
19 |
+
}
|
20 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 512,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
sentencepiece.bpe.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:cfc8146abe2a0488e9e2a0c56de7952f7c11ab059eca145a0a727afce0db2865
|
3 |
+
size 5069051
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": true,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:883b037111086fd4dfebbbc9b7cee11e1517b5e0c0514879478661440f137085
|
3 |
+
size 17082987
|
tokenizer_config.json
ADDED
@@ -0,0 +1,54 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"250001": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": true,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"model_max_length": 512,
|
50 |
+
"pad_token": "<pad>",
|
51 |
+
"sep_token": "</s>",
|
52 |
+
"tokenizer_class": "XLMRobertaTokenizer",
|
53 |
+
"unk_token": "<unk>"
|
54 |
+
}
|