INDEX
Negative Logits
AppBar
-0.07
denial
-0.07
Premium
-0.07
Snow
-0.06
hafif
-0.06
istrator
-0.06
تماس
-0.06
правило
-0.06
된
-0.06
にも
-0.06
POSITIVE LOGITS
’en
0.07
پنج
0.06
เคราะห
0.06
ông
0.06
Respond
0.06
_you
0.06
hear
0.06
'en
0.06
ρι
0.06
YOU
0.06
Activations Density 0.033%