INDEX
Negative Logits
lá
-0.08
everytime
-0.07
accomod
-0.07
142
-0.07
是在
-0.07
"+
-0.07
Era
-0.07
Nice
-0.07
OTT
-0.07
avantaj
-0.07
POSITIVE LOGITS
والج
0.09
ורים
0.08
Benjamin
0.07
Eat
0.07
skulle
0.07
stub
0.07
dictates
0.07
URED
0.07
crowded
0.07
Be
0.07
Activations Density 0.002%