INDEX
Negative Logits
rech
-0.08
ému
-0.08
iru
-0.08
complained
-0.08
terror
-0.08
etc
-0.08
Investig
-0.08
బాధ
-0.08
tev
-0.08
Discard
-0.07
POSITIVE LOGITS
cousin
0.09
cantora
0.08
Triple
0.08
độ
0.08
pov
0.07
gushy
0.07
unanimous
0.07
champagne
0.07
Card
0.07
ಸ್ಟ
0.07
Activations Density 0.031%