INDEX
Negative Logits
ellte
-0.09
icherung
-0.08
posure
-0.08
Liqu
-0.08
صوب
-0.08
Salir
-0.08
ellten
-0.07
సెల
-0.07
orit
-0.07
محبت
-0.07
POSITIVE LOGITS
incr
0.08
debut
0.07
napp
0.07
nime
0.07
dup
0.07
đầu
0.07
najbol
0.07
ដ
0.07
we've
0.07
Adu
0.07
Activations Density 0.007%