INDEX
Negative Logits
ITUDE
-0.08
DOUBLE
-0.08
بادل
-0.07
отнош
-0.07
coag
-0.07
Maintain
-0.07
_LITERAL
-0.07
-life
-0.07
Dyson
-0.07
abz
-0.07
POSITIVE LOGITS
掉
0.15
nette
0.09
cq
0.09
лиш
0.08
/add
0.08
ضر
0.07
correspondent
0.07
tempora
0.07
Hav
0.07
ريب
0.07
Activations Density 0.010%