INDEX
Negative Logits
Doris
-0.08
tlh
-0.07
cobr
-0.07
laut
-0.07
civil
-0.07
.mk
-0.07
leder
-0.07
392
-0.07
Mont
-0.07
.notice
-0.07
POSITIVE LOGITS
വരുന്ന
0.09
থাকা
0.09
resents
0.08
ये
0.07
হও
0.07
itives
0.07
Ago
0.07
असल्य
0.07
Spl
0.07
Straight
0.07
Activations Density 0.011%