INDEX
Negative Logits
Gamb
-0.07
чива
-0.07
.SK
-0.06
Mold
-0.06
cooper
-0.06
Das
-0.06
досвід
-0.06
mnist
-0.06
Cambodia
-0.06
asdf
-0.06
POSITIVE LOGITS
人
0.12
人
0.09
PERSON
0.07
spokesperson
0.07
家
0.07
一人
0.07
_person
0.07
ready
0.06
người
0.06
urers
0.06
Activations Density 0.003%