INDEX
Negative Logits
stip
-0.11
provisions
-0.09
tych
-0.08
Roth
-0.08
mate
-0.08
lit
-0.08
nyt
-0.08
aganda
-0.08
oversees
-0.07
फिल्म
-0.07
POSITIVE LOGITS
zul
0.08
tamam
0.08
kullanılan
0.08
beware
0.08
frag
0.08
WARNING
0.07
fing
0.07
Recommended
0.07
অ
0.07
শেষে
0.07
Activations Density 0.028%