INDEX
Negative Logits
.cloudflare
-0.09
impul
-0.08
費
-0.08
dintre
-0.08
365
-0.07
bullet
-0.07
<std
-0.07
.imp
-0.07
規
-0.07
ases
-0.07
POSITIVE LOGITS
wards
0.08
Money
0.08
ergic
0.08
FAULT
0.08
ача
0.08
ssss
0.08
orse
0.08
money
0.08
sss
0.07
ussed
0.07
Activations Density 0.005%