INDEX
Negative Logits
kl
-0.08
මු
-0.08
absor
-0.08
വഴ
-0.08
לאורך
-0.07
ומה
-0.07
.Down
-0.07
doing
-0.07
throttle
-0.07
intersection
-0.07
POSITIVE LOGITS
aam
0.08
Técnica
0.08
怒
0.08
Pern
0.08
ہم
0.08
箱
0.08
علاج
0.08
pst
0.07
Inp
0.07
troubles
0.07
Activations Density 0.002%