INDEX
Negative Logits
、一
-0.08
óst
-0.08
、多
-0.08
yet
-0.08
dı
-0.07
Ignoring
-0.07
_Move
-0.07
-0.07
-inc
-0.07
новости
-0.07
POSITIVE LOGITS
际
0.09
оспособ
0.08
בית
0.08
-items
0.08
laborum
0.08
ateau
0.08
Anthony
0.08
occaec
0.07
werken
0.07
auff
0.07
Activations Density 0.001%