INDEX
Negative Logits
Newton
-0.09
Tea
-0.09
由于
-0.08
mencapai
-0.08
惊
-0.08
.fac
-0.08
达到
-0.08
公开
-0.07
ശേഷം
-0.07
-Christ
-0.07
POSITIVE LOGITS
movable
0.08
создания
0.08
0.08
VS
0.07
orbit
0.07
स्थान
0.07
bola
0.07
bew
0.07
0.07
원이
0.07
Activations Density 0.001%