INDEX
Negative Logits
勐
-0.08
ACK
-0.07
apple
-0.06
Australian
-0.06
отношении
-0.06
↵
-0.06
Handlers
-0.06
让人
-0.06
альная
-0.06
transmissions
-0.06
POSITIVE LOGITS
кал
0.08
[length
0.07
شعب
0.07
FORCE
0.07
Opera
0.07
딕
0.07
spoilers
0.07
_MESSAGE
0.07
גוף
0.07
красот
0.07
Activations Density 0.004%