INDEX
Negative Logits
bonding
-0.08
antip
-0.08
here
-0.07
design
-0.07
sitter
-0.07
tm
-0.07
heli
-0.07
тепл
-0.07
COVID
-0.07
인지
-0.07
POSITIVE LOGITS
Nim
0.11
nim
0.10
uada
0.09
骰
0.09
أه
0.08
blasts
0.08
cushions
0.08
Slider
0.08
クト
0.08
Dres
0.07
Activations Density 0.001%