INDEX
Negative Logits
pole
-0.08
decret
-0.08
Challenger
-0.08
hydrate
-0.08
pivot
-0.07
Pole
-0.07
�
-0.07
Tut
-0.07
hedge
-0.07
enga
-0.07
POSITIVE LOGITS
eso
0.08
Ty
0.07
544
0.07
anth
0.07
erso
0.07
anese
0.07
_wh
0.07
Ty
0.07
gul
0.07
روی
0.07
Activations Density 0.001%