INDEX
Negative Logits
authenticated
-0.08
.it
-0.07
crou
-0.07
undis
-0.07
орию
-0.07
authenticated
-0.07
cc
-0.07
meld
-0.07
learned
-0.07
formidable
-0.07
POSITIVE LOGITS
aka
0.09
(!)
0.08
_escape
0.08
Escape
0.08
dar
0.08
خات
0.08
ت
0.08
Հայ
0.08
reverting
0.07
逃
0.07
Activations Density 0.001%