INDEX
Negative Logits
қ
-0.09
ковой
-0.08
Ай
-0.08
ちゃん
-0.08
пой
-0.08
Tal
-0.07
kuz
-0.07
целью
-0.07
ай
-0.07
keng
-0.07
POSITIVE LOGITS
unu
0.09
thereof
0.09
Zustimmung
0.08
/accounts
0.08
491
0.08
hw
0.08
reguli
0.07
inguished
0.07
684
0.07
Dieses
0.07
Activations Density 0.006%