INDEX
Negative Logits
philosoph
-0.09
gently
-0.07
questions
-0.07
national
-0.07
adians
-0.07
SOC
-0.07
uest
-0.07
accessed
-0.07
政策
-0.07
الوطن
-0.07
POSITIVE LOGITS
Encode
0.09
Encoding
0.08
驰
0.08
УЛ
0.08
две
0.08
heerlijk
0.08
Hein
0.08
hurry
0.08
elimination
0.08
يي
0.08
Activations Density 0.003%