INDEX
Negative Logits
.JWT
-0.07
_REPEAT
-0.06
価
-0.06
開
-0.06
Kiểm
-0.06
nuevo
-0.06
uz
-0.06
aute
-0.06
ivalence
-0.06
-building
-0.06
POSITIVE LOGITS
assaulting
0.06
portrays
0.06
Kraj
0.06
Steering
0.06
Abdul
0.06
۱۹۶
0.06
astype
0.06
Bj
0.06
minate
0.06
ransom
0.05
Activations Density 0.095%