INDEX
Negative Logits
挑
-0.08
sb
-0.08
factual
-0.07
barr
-0.07
ombi
-0.07
এন
-0.07
(sb
-0.07
Son
-0.07
别人
-0.07
ір
-0.07
POSITIVE LOGITS
giro
0.10
وكانت
0.08
redir
0.08
kurt
0.07
Bowen
0.07
Portugu
0.07
Ocean
0.07
त्यामुळे
0.07
Katherine
0.07
Ank
0.07
Activations Density 0.266%