INDEX
Negative Logits
ignored
-0.06
效果
-0.06
спож
-0.06
هوش
-0.06
_UTIL
-0.06
ransom
-0.06
Apprent
-0.06
manager
-0.06
_proof
-0.06
liament
-0.06
POSITIVE LOGITS
circa
0.07
etwa
0.07
polls
0.06
การณ
0.06
п
0.06
actors
0.06
hacia
0.06
Luft
0.06
AUSE
0.06
+s
0.06
Activations Density 0.007%