INDEX
Negative Logits
hemisphere
-0.09
gewenste
-0.08
isal
-0.08
Kill
-0.08
Orbit
-0.08
orbit
-0.08
owes
-0.08
reminiscent
-0.07
_urls
-0.07
insensitive
-0.07
POSITIVE LOGITS
vok
0.08
nej
0.08
hens
0.08
jub
0.08
hata
0.07
komun
0.07
imperial
0.07
Nej
0.07
ને
0.07
inmediato
0.07
Activations Density 0.090%