INDEX
Negative Logits
tandis
-0.08
.foreach
-0.08
które
-0.08
_FORWARD
-0.08
-là
-0.08
więc
-0.08
ון
-0.08
glove
-0.08
wee
-0.08
arl
-0.07
POSITIVE LOGITS
Mitt
0.08
rut
0.08
thereafter
0.08
Mitt
0.08
imbra
0.08
manchas
0.08
Dic
0.07
まで
0.07
వరకు
0.07
Ấ
0.07
Activations Density 0.106%