INDEX
Negative Logits
lawful
-0.08
NSA
-0.08
aub
-0.08
Fu
-0.08
Sho
-0.08
eddings
-0.07
fio
-0.07
�
-0.07
DUSTR
-0.07
Spazier
-0.07
POSITIVE LOGITS
英雄
0.08
simplex
0.08
Ocean
0.08
oral
0.07
েয়
0.07
-এর
0.07
Touched
0.07
যুক্ত
0.07
_rep
0.07
(The
0.07
Activations Density 0.008%