INDEX
Negative Logits
രുന്നത്
0.43
苦手
0.41
)}_
0.40
्यालय
0.40
võimalik
0.39
ítő
0.38
opge
0.38
lès
0.37
differing
0.37
ница
0.37
POSITIVE LOGITS
rather
0.75
plutôt
0.64
instead
0.61
invece
0.61
chứ
0.58
Rather
0.58
而不是
0.58
piuttosto
0.57
বরং
0.56
rather
0.56
Activations Density 0.000%