INDEX
Negative Logits
nd
-0.07
provoc
-0.07
Kia
-0.06
uju
-0.06
privileges
-0.06
exp
-0.06
bluff
-0.06
WLAN
-0.06
put
-0.06
Cc
-0.06
POSITIVE LOGITS
двер
0.07
closer
0.07
green
0.07
amend
0.07
Coal
0.06
Green
0.06
Chunks
0.06
Cipher
0.06
ınıza
0.06
іншими
0.06
Activations Density 0.030%