INDEX
Negative Logits
büy
-0.08
stø
-0.08
inevitable
-0.08
spett
-0.07
neglected
-0.07
Pune
-0.07
lifestyles
-0.07
Sv
-0.07
टर
-0.07
gete
-0.07
POSITIVE LOGITS
کیوں
0.10
有什么
0.10
ఎంద
0.10
이유
0.09
¿Por
0.09
क्यों
0.09
Why
0.09
raisons
0.08
_reason
0.08
why
0.08
Activations Density 0.072%