INDEX
Negative Logits
471
-0.07
petit
-0.07
bunny
-0.06
lname
-0.06
hơi
-0.06
Judith
-0.06
�
-0.06
46
-0.06
.alias
-0.06
.easy
-0.06
POSITIVE LOGITS
Reg
0.11
Reg
0.11
reg
0.09
-reg
0.08
ereg
0.08
reg
0.07
regulating
0.07
egal
0.07
掌
0.07
Regional
0.07
Activations Density 0.051%