INDEX
Negative Logits
Brad
-0.09
Servo
-0.08
DEF
-0.07
cou
-0.07
timp
-0.07
birlik
-0.07
espac
-0.07
allegiance
-0.07
ান্ত
-0.07
Gt
-0.07
POSITIVE LOGITS
fatal
0.09
.sum
0.08
0.07
生命
0.07
hort
0.07
nieder
0.07
soul
0.07
करती
0.07
помещ
0.07
revoir
0.07
Activations Density 0.003%