INDEX
Negative Logits
ge
-0.08
izen
-0.08
zm
-0.07
-web
-0.07
m
-0.07
�
-0.07
di
-0.07
gum
-0.07
haw
-0.07
alma
-0.07
POSITIVE LOGITS
cycles
0.11
cycling
0.11
cyc
0.10
_cycles
0.10
cyclic
0.10
toggle
0.09
cycling
0.09
цик
0.09
周期
0.09
Cycles
0.09
Activations Density 0.041%