INDEX
Negative Logits
Offensive
-0.07
flere
-0.06
_FIRE
-0.06
cell
-0.06
showers
-0.06
쳐
-0.06
mouseleave
-0.06
mobile
-0.06
lectric
-0.06
.masksToBounds
-0.06
POSITIVE LOGITS
チーム
0.07
这个
0.06
μένες
0.06
در
0.06
acidad
0.06
Addiction
0.06
răng
0.06
осві
0.06
arry
0.06
aber
0.06
Activations Density 0.001%