INDEX
Negative Logits
.decor
-0.16
кÑģ
-0.15
reater
-0.15
uada
-0.15
ollo
-0.15
STANCE
-0.14
Pragma
-0.14
rias
-0.14
Ñħодим
-0.14
ÅĽci
-0.14
POSITIVE LOGITS
³
0.15
wort
0.14
utut
0.14
Sz
0.14
bron
0.14
ÐĴÐIJ
0.13
inke
0.13
ziel
0.13
lauf
0.13
influ
0.13
Activations Density 0.004%