INDEX
Negative Logits
ئية
-0.08
_ud
-0.08
�
-0.08
Norman
-0.07
નજર
-0.07
ooking
-0.07
arial
-0.07
দিকে
-0.07
škai
-0.07
Warm
-0.07
POSITIVE LOGITS
τα
0.07
adm
0.07
solve
0.07
Drew
0.07
formen
0.07
incar
0.07
0.07
satisfe
0.07
akav
0.06
provis
0.06
Activations Density 0.075%