INDEX
Negative Logits
-0.08
Gut
-0.08
upright
-0.08
tuna
-0.07
eure
-0.07
Labor
-0.07
Classes
-0.07
fec
-0.07
NBT
-0.07
ο
-0.07
POSITIVE LOGITS
bog
0.10
సమ
0.08
0.08
Wa
0.07
Dar
0.07
מס
0.07
имых
0.07
aq
0.07
เสนอ
0.07
.pr
0.07
Activations Density 0.006%