INDEX
Negative Logits
flooding
-0.07
KD
-0.06
(NS
-0.06
SX
-0.06
.Format
-0.06
center
-0.06
сад
-0.06
ister
-0.06
ानक
-0.06
кад
-0.06
POSITIVE LOGITS
########################################################
0.07
937
0.06
desarrollo
0.06
메
0.06
541
0.06
Osborne
0.06
/chat
0.06
ampl
0.06
qv
0.06
าผ
0.06
Activations Density 0.007%