INDEX
Negative Logits
pole
-0.09
true
-0.08
trou
-0.07
stellen
-0.07
original
-0.07
.World
-0.07
證明
-0.07
🙊
-0.07
u
-0.07
tä
-0.07
POSITIVE LOGITS
消防安全
0.07
.performance
0.07
消费者的
0.07
aşağıdaki
0.07
validar
0.07
شركات
0.07
法师职业
0.07
솀
0.07
ńsk
0.07
Require
0.07
Activations Density 0.021%