INDEX
Negative Logits
Himself
-0.09
의해
-0.08
Norris
-0.08
인해
-0.07
społ
-0.07
successful
-0.07
pc
-0.07
annuel
-0.07
stunt
-0.07
=sum
-0.07
POSITIVE LOGITS
松
0.09
用品
0.08
辅
0.08
iphone
0.08
downs
0.08
叶
0.07
ods
0.07
consolidation
0.07
retreat
0.07
cél
0.07
Activations Density 0.008%