INDEX
Negative Logits
ורת
-0.08
춘
-0.08
Mess
-0.07
'./
-0.07
masked
-0.07
./
-0.07
מת
-0.07
touch
-0.07
�
-0.07
wired
-0.07
POSITIVE LOGITS
apologies
0.09
lament
0.09
olvid
0.08
-Origin
0.08
استراتيجية
0.08
apologize
0.08
exercice
0.08
necesito
0.08
eeper
0.08
marge
0.08
Activations Density 0.000%