INDEX
Negative Logits
isspace
-0.07
user
-0.07
manifestation
-0.06
necessity
-0.06
(types
-0.06
_vocab
-0.06
اتاق
-0.06
urma
-0.06
participation
-0.06
McCabe
-0.06
POSITIVE LOGITS
-controlled
0.07
skeletons
0.07
latex
0.07
Ex
0.06
Allied
0.06
visto
0.06
/z
0.06
symbol
0.06
elderly
0.06
iciente
0.06
Activations Density 0.009%