INDEX
Negative Logits
caves
-0.08
نع
-0.08
uneven
-0.08
falando
-0.08
divulg
-0.07
lounges
-0.07
mọi
-0.07
branding
-0.07
topology
-0.07
nich
-0.07
POSITIVE LOGITS
/k
0.09
dauern
0.08
Explanation
0.08
Hung
0.08
[k
0.08
vergence
0.08
Explanation
0.08
sar
0.07
Tidak
0.07
0.07
Activations Density 0.001%