INDEX
Negative Logits
划分
-0.08
apan
-0.08
ана
-0.08
учет
-0.07
אותם
-0.07
naam
-0.07
chw
-0.07
_snap
-0.07
Kai
-0.07
opcion
-0.07
POSITIVE LOGITS
give
0.08
敌
0.08
strument
0.08
around
0.08
Stones
0.07
Near
0.07
틍
0.07
为代表
0.07
pedestrian
0.07
restricting
0.07
Activations Density 0.002%