INDEX
Negative Logits
Simpl
-0.09
简
-0.09
Simpl
-0.08
Current
-0.08
模
-0.08
.current
-0.08
simplifies
-0.08
afirma
-0.08
Simulator
-0.08
simplified
-0.07
POSITIVE LOGITS
wrath
0.09
boast
0.08
quas
0.08
sorrow
0.08
apart
0.08
Zeus
0.08
indirectly
0.07
#ifdef
0.07
ae
0.07
divine
0.07
Activations Density 0.024%