INDEX
Negative Logits
Ih
-0.09
and
-0.08
ុ
-0.08
Kirst
-0.08
gow
-0.08
hhh
-0.07
Shannon
-0.07
roh
-0.07
Diff
-0.07
լին
-0.07
POSITIVE LOGITS
wield
0.08
Primera
0.08
vessels
0.08
심
0.08
युक्त
0.08
hil
0.08
itaan
0.07
wandering
0.07
夕
0.07
semiconductor
0.07
Activations Density 0.006%