INDEX
Negative Logits
uLocal
-0.07
lor
-0.07
illard
-0.07
汕
-0.07
ror
-0.07
_prime
-0.06
*'
-0.06
ɧ
-0.06
toplantı
-0.06
ſt
-0.06
POSITIVE LOGITS
Nom
0.08
"↵
0.08
";↵
0.08
defer
0.08
更能
0.07
)"↵
0.07
)",↵
0.07
cher
0.07
'}';↵
0.07
.";↵
0.07
Activations Density 0.001%