INDEX
Negative Logits
unleash
-0.09
നായ
-0.09
_food
-0.09
െന്നും
-0.08
greenery
-0.08
лого
-0.08
unle
-0.08
_cookie
-0.08
ulty
-0.08
náv
-0.08
POSITIVE LOGITS
linewidth
0.13
impur
0.11
forbidden
0.11
delta
0.10
Δ
0.09
distortion
0.09
coupling
0.09
interference
0.09
perturb
0.09
impurities
0.09
Activations Density 0.003%