INDEX
Negative Logits
Shop
-0.09
-shop
-0.08
binaries
-0.08
_shop
-0.08
은
-0.08
applic
-0.08
ಬರುತ್ತ
-0.07
shops
-0.07
menus
-0.07
Oc
-0.07
POSITIVE LOGITS
ून
0.08
.More
0.08
ोड
0.08
िला
0.08
oping
0.07
انس
0.07
.msg
0.07
قيام
0.07
Nor
0.07
William
0.07
Activations Density 0.001%