INDEX
Negative Logits
Beine
-0.08
guar
-0.08
তিন
-0.08
Zi
-0.08
petition
-0.07
Suzuki
-0.07
sluiten
-0.07
يتح
-0.07
anych
-0.07
Streit
-0.07
POSITIVE LOGITS
shine
0.08
hardware
0.08
ppo
0.08
☆↵
0.08
foule
0.08
“It
0.08
mær
0.07
donut
0.07
vá
0.07
=");↵
0.07
Activations Density 0.002%