INDEX
Negative Logits
a
-0.08
ul
-0.08
definitive
-0.07
oss
-0.07
ul
-0.07
湖南
-0.07
akhir
-0.07
middels
-0.07
clear
-0.07
d
-0.07
POSITIVE LOGITS
politici
0.08
hal
0.08
ген
0.08
Capitol
0.08
ీలో
0.08
ignorant
0.07
scouting
0.07
chai
0.07
üge
0.07
transmitting
0.07
Activations Density 0.176%