INDEX
Negative Logits
athon
-0.08
_MEM
-0.08
don
-0.08
deform
-0.07
aren
-0.07
fitness
-0.07
-Marie
-0.07
162
-0.07
155
-0.07
налич
-0.07
POSITIVE LOGITS
ించాడు
0.08
)paren
0.08
aandacht
0.08
העבודה
0.08
glamorous
0.07
電話
0.07
Think
0.07
יקל
0.07
ਿੰ
0.07
Amit
0.07
Activations Density 0.010%