INDEX
Negative Logits
consequence
-0.08
_USED
-0.08
电脑
-0.08
建立
-0.08
ドラ
-0.08
效
-0.07
lickr
-0.07
Wird
-0.07
usos
-0.07
ARD
-0.07
POSITIVE LOGITS
ใหม่
0.09
légèrement
0.08
пришлось
0.08
придется
0.08
νέο
0.08
ligeramente
0.08
чист
0.08
приходится
0.08
než
0.08
classifier
0.07
Activations Density 0.007%