INDEX
Negative Logits
Eng
-0.07
outra
-0.07
"path
-0.07
agg
-0.07
בכל
-0.07
air
-0.07
ﻷ
-0.07
ادة
-0.07
placer
-0.07
逃脱
-0.07
POSITIVE LOGITS
jid
0.08
composer
0.07
.sd
0.07
comedian
0.07
_rewrite
0.07
_lift
0.07
gratuite
0.07
donnees
0.07
caption
0.07
Gon
0.06
Activations Density 0.001%