INDEX
Negative Logits
hire
-0.09
hire
-0.08
告诉
-0.08
告
-0.08
incididunt
-0.08
228
-0.08
kız
-0.08
yakho
-0.08
खुश
-0.08
partita
-0.08
POSITIVE LOGITS
internal
0.09
内部
0.08
TJ
0.08
occasionally
0.08
സംഭവ
0.08
Internal
0.07
gradually
0.07
inaccessible
0.07
.Internal
0.07
وط
0.07
Activations Density 0.002%