INDEX
Negative Logits
Sho
-0.08
wash
-0.08
HOM
-0.08
Perfect
-0.07
Problem
-0.07
theit
-0.07
�
-0.07
392
-0.07
evade
-0.07
ುತ್ತದೆ
-0.07
POSITIVE LOGITS
asleep
0.08
ethos
0.08
abroad
0.08
abd
0.08
چے
0.07
oks
0.07
چہ
0.07
sert
0.07
dienst
0.07
自在
0.07
Activations Density 0.006%