INDEX
Negative Logits
prefer
-0.10
naturl
-0.09
natural
-0.08
avan
-0.08
Natural
-0.08
Natural
-0.08
ayat
-0.08
avana
-0.07
preferred
-0.07
Studio
-0.07
POSITIVE LOGITS
-haired
0.09
Ingen
0.08
cohol
0.08
мач
0.08
phon
0.08
°.
0.08
ਵੇ
0.07
电话
0.07
стэр
0.07
汽
0.07
Activations Density 0.000%