INDEX
Negative Logits
Leone
-0.07
ple
-0.07
ورود
-0.07
sauna
-0.06
Paint
-0.06
brew
-0.06
accelerometer
-0.06
角色
-0.06
kovou
-0.06
döneminde
-0.06
POSITIVE LOGITS
=lambda
0.08
ッチ
0.07
arently
0.06
discourage
0.06
.inc
0.06
olmak
0.06
somew
0.06
strap
0.06
(aux
0.06
uco
0.06
Activations Density 0.028%