INDEX
Negative Logits
쓰
-0.07
Found
-0.07
ALPHA
-0.07
dz
-0.06
_near
-0.06
悠
-0.06
více
-0.06
convin
-0.06
rh
-0.06
δύο
-0.06
POSITIVE LOGITS
Cooperation
0.07
harmless
0.06
ANGLES
0.06
URRED
0.06
ritable
0.06
uraa
0.06
forcement
0.06
Cowboys
0.06
621
0.06
roj
0.06
Activations Density 0.095%