INDEX
Negative Logits
warden
-0.10
urlijke
-0.09
bled
-0.09
wig
-0.09
ipid
-0.08
krar
-0.08
hera
-0.08
bles
-0.08
rotating
-0.08
urlijk
-0.08
POSITIVE LOGITS
аж
0.11
ажи
0.10
ajajo
0.10
avnom
0.09
ાન
0.09
ано
0.08
айте
0.08
ад
0.08
aje
0.08
าจะ
0.08
Activations Density 0.001%