INDEX
Negative Logits
linear
-0.08
स्ट्र
-0.08
قام
-0.08
unfor
-0.07
حية
-0.07
만드는
-0.07
inconvenient
-0.07
ABC
-0.07
playground
-0.07
Inline
-0.07
POSITIVE LOGITS
বন
0.09
nuit
0.08
夜
0.08
_Per
0.08
ночь
0.08
tranquill
0.08
priv
0.08
ರಾತ್ರಿ
0.08
밤
0.08
രാത്ര
0.08
Activations Density 0.003%