INDEX
Negative Logits
foro
-0.08
219
-0.08
_;↵↵
-0.07
sizeable
-0.07
hwnd
-0.07
adrat
-0.07
pensamiento
-0.07
#if
-0.07
Hari
-0.07
_neg
-0.07
POSITIVE LOGITS
troph
0.09
القص
0.09
yn
0.08
ufuna
0.08
descriptions
0.08
Humph
0.07
>Description
0.07
bewijs
0.07
lam
0.07
étrange
0.07
Activations Density 0.005%