INDEX
Negative Logits
gen
-0.08
mj
-0.07
-0.07
tower
-0.07
koos
-0.07
interest
-0.07
Morrison
-0.07
nec
-0.07
mam
-0.07
duur
-0.07
POSITIVE LOGITS
ированы
0.09
assimilation
0.09
assimil
0.09
Assim
0.09
.eks
0.09
vlo
0.08
深
0.08
붙
0.08
Assim
0.08
.Rem
0.08
Activations Density 0.009%