INDEX
Negative Logits
Granted
-0.08
dout
-0.08
всему
-0.07
ної
-0.07
umist
-0.07
kiej
-0.07
(«
-0.07
mov
-0.07
CONSULT
-0.07
『
-0.07
POSITIVE LOGITS
hingegen
0.10
另一方面
0.09
naman
0.09
invece
0.09
meanwhile
0.09
aren
0.08
isə
0.08
leden
0.08
Meanwhile
0.08
Raven
0.08
Activations Density 0.071%