INDEX
Negative Logits
Es
-0.08
_ls
-0.08
奋斗
-0.08
feats
-0.08
Es
-0.07
�
-0.07
לי
-0.07
relates
-0.07
insignificant
-0.07
ideas
-0.07
POSITIVE LOGITS
때문
0.10
слишком
0.09
nedeniyle
0.09
때문이다
0.09
_TOO
0.09
terlalu
0.09
Too
0.08
Too
0.08
కారణ
0.08
_due
0.08
Activations Density 0.198%