INDEX
Negative Logits
이루
-0.08
satisfactor
-0.08
ebb
-0.08
lim
-0.07
TW
-0.07
zeb
-0.07
namely
-0.07
descon
-0.07
IMAL
-0.07
fishes
-0.07
POSITIVE LOGITS
disclaim
0.12
进去
0.10
一句
0.10
-ons
0.09
vào
0.09
туда
0.09
slashes
0.08
إليها
0.08
impormasyon
0.08
absolument
0.08
Activations Density 0.028%