INDEX
Negative Logits
gö
-0.09
tongue
-0.08
কিং
-0.08
AVG
-0.08
Forever
-0.08
udet
-0.07
टो
-0.07
symposium
-0.07
소드
-0.07
uru
-0.07
POSITIVE LOGITS
propone
0.08
0.08
match
0.08
_ar
0.07
writ
0.07
aviar
0.07
badly
0.07
وو
0.07
shaky
0.07
demonstrate
0.07
Activations Density 0.000%