INDEX
Negative Logits
睛
-0.08
析
-0.08
মৌ
-0.08
unethical
-0.08
年代
-0.08
기를
-0.08
anol
-0.08
britt
-0.08
inee
-0.08
faites
-0.08
POSITIVE LOGITS
Viet
0.08
spacious
0.08
mirror
0.07
Doh
0.07
601
0.07
902
0.07
Iw
0.07
Duplex
0.07
Amin
0.07
KNR
0.07
Activations Density 0.011%