INDEX
Negative Logits
designed
-0.08
wọ
-0.08
fól
-0.08
CTL
-0.07
čas
-0.07
grave
-0.07
disparate
-0.07
होत
-0.07
unl
-0.07
chống
-0.07
POSITIVE LOGITS
Dar
0.10
Unterneh
0.09
trovato
0.09
dar
0.08
곳
0.08
interpolate
0.08
찾아
0.08
내부
0.08
erat
0.08
_interp
0.08
Activations Density 0.012%