INDEX
Negative Logits
trad
-0.07
fad
-0.06
Cos
-0.06
(**
-0.06
СТ
-0.06
istribution
-0.06
classifier
-0.06
البحث
-0.06
Ded
-0.06
tricks
-0.06
POSITIVE LOGITS
mounts
0.09
mount
0.08
Mount
0.08
mont
0.07
امت
0.07
μα
0.07
Maurice
0.07
marching
0.07
_PKT
0.07
มน
0.07
Activations Density 0.010%