INDEX
Negative Logits
etsa
-0.08
emperor
-0.08
onso
-0.08
aporan
-0.08
determination
-0.08
-0.07
ащ
-0.07
tur
-0.07
928
-0.07
fär
-0.07
POSITIVE LOGITS
gostar
0.09
.xhtml
0.09
যায়
0.08
Stayed
0.08
ਗੀ
0.08
ところ
0.08
erwarten
0.08
کیفیت
0.08
만큼
0.08
대로
0.08
Activations Density 0.026%