INDEX
Negative Logits
航空
-0.07
demean
-0.06
pupil
-0.06
mát
-0.06
ικού
-0.06
Fifth
-0.06
enums
-0.06
ラ
-0.06
nose
-0.06
الأح
-0.06
POSITIVE LOGITS
attle
0.07
Expression
0.07
gratuit
0.07
cattle
0.06
Wort
0.06
Red
0.06
execute
0.06
Michele
0.06
.location
0.06
abile
0.06
Activations Density 0.009%