INDEX
Negative Logits
reproduc
-0.08
ulti
-0.08
ullivan
-0.08
KD
-0.07
�
-0.07
diminu
-0.07
rs
-0.07
mor
-0.07
duc
-0.07
DX
-0.07
POSITIVE LOGITS
ٿيڻ
0.08
Boy
0.08
gif
0.08
Gif
0.08
Bahamas
0.07
Chong
0.07
رای
0.07
િતા
0.07
Weiss
0.07
Hole
0.07
Activations Density 0.003%