INDEX
Negative Logits
implicit
-0.07
Simply
-0.07
ferv
-0.07
Clair
-0.07
ישנם
-0.06
占地
-0.06
-Owned
-0.06
widely
-0.06
lsp
-0.06
Sword
-0.06
POSITIVE LOGITS
uales
0.07
教程
0.07
רש
0.07
عين
0.07
الحقوق
0.07
:a
0.07
ож
0.07
过错
0.06
鳤
0.06
pans
0.06
Activations Density 0.004%