INDEX
Negative Logits
arbit
-0.08
Mata
-0.07
Wing
-0.07
przy
-0.07
"_
-0.07
一种
-0.07
War
-0.07
asjon
-0.07
_WE
-0.07
monarch
-0.07
POSITIVE LOGITS
上述
0.09
που
0.09
newcomer
0.08
τές
0.08
োজন
0.08
Randy
0.08
aforementioned
0.07
above
0.07
αυτές
0.07
④
0.07
Activations Density 0.062%