INDEX
Negative Logits
C
-0.07
submitted
-0.06
_lens
-0.06
数据
-0.06
Sounds
-0.06
estimation
-0.06
imaginative
-0.06
explor
-0.06
hodin
-0.06
Var
-0.06
POSITIVE LOGITS
bapt
0.10
christian
0.09
Christian
0.08
!↵↵↵
0.07
Thank
0.07
Christian
0.07
baptism
0.07
вок
0.07
Baptist
0.07
violent
0.06
Activations Density 0.001%