INDEX
Negative Logits
Rivers
-0.08
os
-0.07
=L
-0.07
writing
-0.07
Lè
-0.07
RM
-0.07
Resort
-0.07
rose
-0.07
berg
-0.07
<G
-0.06
POSITIVE LOGITS
заг
0.08
PQ
0.08
tali
0.08
�
0.07
Aq
0.07
CF
0.07
서로
0.07
zgod
0.07
mechanical
0.07
edict
0.07
Activations Density 0.014%