INDEX
Negative Logits
positivos
-0.09
laden
-0.09
olum
-0.09
actuator
-0.08
مطلوب
-0.08
Act
-0.08
Responder
-0.08
positief
-0.08
/Internal
-0.08
axle
-0.08
POSITIVE LOGITS
halter
0.07
Gw
0.07
Python
0.07
동안
0.07
unemployment
0.07
人生
0.07
Berufs
0.07
Gs
0.07
мов
0.07
생활
0.07
Activations Density 0.004%