INDEX
Negative Logits
/Re
-0.08
Sauv
-0.08
sofas
-0.08
Anderson
-0.08
Verlet
-0.08
�
-0.08
Trong
-0.08
lærer
-0.07
PCs
-0.07
Ayrıca
-0.07
POSITIVE LOGITS
tration
0.08
Thin
0.08
пер
0.08
gan
0.07
Gan
0.07
Circ
0.07
0.07
kern
0.07
Quiet
0.07
320
0.07
Activations Density 0.004%