INDEX
Negative Logits
knives
-0.07
↵
-0.06
/validation
-0.06
booklet
-0.06
lowering
-0.06
Withdraw
-0.06
�
-0.06
Rev
-0.06
奴
-0.06
_Cl
-0.06
POSITIVE LOGITS
east
0.14
East
0.14
East
0.12
EAST
0.10
-east
0.09
東
0.09
東
0.08
شرق
0.08
vých
0.08
eastern
0.08
Activations Density 0.018%