INDEX
Negative Logits
hatred
-0.07
Е
-0.06
modify
-0.06
ji
-0.06
SPELL
-0.06
Britain
-0.06
beg
-0.06
Nine
-0.06
Kitty
-0.06
straight
-0.06
POSITIVE LOGITS
Tao
0.07
منزل
0.06
apanese
0.06
.CR
0.06
ीट
0.06
″E
0.06
ойчив
0.06
_lifetime
0.06
0.06
\-
0.06
Activations Density 0.028%