INDEX
Negative Logits
мәс
-0.09
въ
-0.09
-cü
-0.09
ŵr
-0.08
-rise
-0.08
用品
-0.08
ystone
-0.08
SYM
-0.08
ктар
-0.08
приз
-0.08
POSITIVE LOGITS
honesty
0.08
_quotes
0.07
ojis
0.07
�
0.07
Hindi
0.07
noun
0.07
verbosity
0.07
unsolicited
0.07
enthusiasm
0.07
باش
0.07
Activations Density 0.001%