INDEX
Negative Logits
descubr
-0.08
之外
-0.07
Soy
-0.07
merch
-0.07
PLACE
-0.07
ENV
-0.07
place
-0.07
.er
-0.07
okoli
-0.07
Aug
-0.07
POSITIVE LOGITS
219
0.07
619
0.07
stern
0.07
stink
0.07
═
0.07
简称
0.07
-upper
0.07
571
0.07
Everyone
0.07
لەر
0.07
Activations Density 0.109%