INDEX
Negative Logits
改革
-0.07
Cop
-0.06
prefer
-0.06
UB
-0.06
nast
-0.06
peaceful
-0.06
Providers
-0.06
آخر
-0.06
があった
-0.06
dirty
-0.06
POSITIVE LOGITS
知
0.07
inand
0.07
UserId
0.06
shim
0.06
velk
0.06
componentWill
0.06
lico
0.06
ranger
0.06
PVC
0.06
blev
0.06
Activations Density 0.012%