INDEX
Negative Logits
Wey
-0.09
grap
-0.07
l
-0.07
unak
-0.07
объ
-0.07
všech
-0.07
deformation
-0.07
ર્ચ
-0.07
feste
-0.07
familiarity
-0.07
POSITIVE LOGITS
oble
0.08
Specifier
0.07
ssl
0.07
sus
0.07
AIS
0.07
Moz
0.07
Kirch
0.07
gain
0.07
Mozilla
0.07
rae
0.07
Activations Density 0.002%