INDEX
Negative Logits
oogle
-0.07
energy
-0.07
uniform
-0.07
Trafford
-0.07
>T
-0.07
minerals
-0.07
Liberals
-0.07
Reflex
-0.07
sewer
-0.07
FLT
-0.06
POSITIVE LOGITS
cá
0.06
паци
0.06
trai
0.06
診
0.06
とも
0.06
编
0.06
adv
0.06
은
0.05
ա
0.05
워
0.05
Activations Density 0.021%