INDEX
Negative Logits
SUPER
-0.09
SEC
-0.08
uitsluitend
-0.08
NEC
-0.08
ਕਾਰ
-0.08
εκπ
-0.08
ilíc
-0.07
دهد
-0.07
Ef
-0.07
GRAND
-0.07
POSITIVE LOGITS
demeanor
0.09
bery
0.09
vali
0.09
vedo
0.08
sto
0.08
-faced
0.08
moo
0.08
0.08
mute
0.08
wv
0.07
Activations Density 0.002%