INDEX
Negative Logits
leep
-0.09
rush
-0.08
facilitates
-0.08
universe
-0.08
sealed
-0.08
borg
-0.08
(lower
-0.07
lower
-0.07
secrecy
-0.07
illustri
-0.07
POSITIVE LOGITS
Avec
0.08
Gn
0.08
Roh
0.07
(fname
0.07
వ్య
0.07
uru
0.07
otro
0.07
afan
0.07
adapté
0.07
ాతం
0.07
Activations Density 0.001%