INDEX
Negative Logits
чуть
-0.09
cond
-0.08
lived
-0.08
intellig
-0.08
brushed
-0.08
bat
-0.07
.Product
-0.07
merece
-0.07
Wort
-0.07
lyk
-0.07
POSITIVE LOGITS
,因为
0.08
邪
0.08
,此
0.08
/no
0.07
—they
0.07
специальные
0.07
اعمال
0.07
Nx
0.07
्ट
0.07
tersom
0.07
Activations Density 0.017%