INDEX
Negative Logits
['<{-0.07
appropriated
-0.06
obyvatel
-0.06
Duch
-0.06
ену
-0.06
산
-0.06
Olsen
-0.06
YY
-0.06
다운
-0.06
experimentation
-0.06
POSITIVE LOGITS
.env
0.07
(single
0.07
_FULL
0.07
motel
0.06
Максим
0.06
_agents
0.06
Material
0.06
�
0.06
)._
0.06
(current
0.06
Activations Density 0.007%