INDEX
Negative Logits
成果
-0.08
faptul
-0.07
ná
-0.07
dap
-0.07
svého
-0.07
ਕੁ
-0.07
ਤੀ
-0.07
alsof
-0.07
tl
-0.07
raro
-0.07
POSITIVE LOGITS
-elles
0.11
কি
0.11
ли
0.10
mı
0.10
kanjani
0.10
apparently
0.09
?"
0.09
______
0.09
왔다
0.09
?",
0.08
Activations Density 0.160%