INDEX
Negative Logits
+/-
-0.09
+-
-0.08
_cap
-0.08
±
-0.08
அறிவ
-0.08
±
-0.07
ENV
-0.07
888
-0.07
environments
-0.07
slots
-0.07
POSITIVE LOGITS
schlim
0.09
Negative
0.09
evil
0.09
negative
0.09
Increasing
0.08
χει
0.08
usiai
0.08
_negative
0.08
ELY
0.08
thern
0.08
Activations Density 0.015%