INDEX
Negative Logits
times
-0.08
(=
-0.07
phe
-0.07
suplement
-0.07
негов
-0.07
هذا
-0.07
poultry
-0.07
Xi
-0.07
master's
-0.07
ಚ್ಚ
-0.07
POSITIVE LOGITS
余
0.09
vida
0.08
“.↵↵
0.08
vist
0.08
ушылар
0.08
“大
0.08
weiter
0.08
_adv
0.08
itäten
0.08
“小
0.08
Activations Density 0.005%