INDEX
Negative Logits
Occ
-0.07
notification
-0.07
舗
-0.07
secondo
-0.07
única
-0.07
_Delay
-0.07
FH
-0.06
_up
-0.06
elidir
-0.06
shaving
-0.06
POSITIVE LOGITS
afflict
0.07
oslo
0.06
tings
0.06
NIEnv
0.06
english
0.06
ampler
0.06
Pete
0.06
male
0.05
pest
0.05
برنامج
0.05
Activations Density 0.052%