INDEX
Negative Logits
ég
-0.08
Cons
-0.07
ank
-0.07
untos
-0.07
פן
-0.07
ển
-0.07
agn
-0.06
disadv
-0.06
ウ
-0.06
cogn
-0.06
POSITIVE LOGITS
suspended
0.08
REPRESENT
0.07
.but
0.07
helicopters
0.07
大城市
0.07
propositions
0.07
更像是
0.07
맫
0.07
נוספת
0.07
_connect
0.07
Activations Density 0.016%