INDEX
Negative Logits
úrov
-0.07
_BEFORE
-0.07
GLOBAL
-0.07
beaches
-0.07
(gp
-0.07
міжнарод
-0.06
غة
-0.06
kennen
-0.06
러
-0.06
solver
-0.06
POSITIVE LOGITS
isecond
0.06
чає
0.06
Lint
0.06
onsense
0.06
exercise
0.06
군
0.06
reinc
0.06
üyük
0.06
drink
0.05
.sprite
0.05
Activations Density 0.029%