INDEX
Negative Logits
�
-0.08
政
-0.08
倒
-0.08
一点
-0.08
cus
-0.07
werte
-0.07
ನ್ನ
-0.07
accru
-0.07
汽
-0.07
werden
-0.07
POSITIVE LOGITS
Bon
0.09
Kow
0.08
Plain
0.08
Tro
0.08
Dud
0.08
Wedding
0.08
teil
0.07
Bon
0.07
sponge
0.07
stiff
0.07
Activations Density 0.005%