INDEX
Negative Logits
plac
-0.08
/Grid
-0.08
.Alignment
-0.07
奔
-0.07
పడ
-0.07
ಗಳ
-0.07
这一
-0.07
якой
-0.07
boosted
-0.07
Plac
-0.07
POSITIVE LOGITS
"(
0.09
ว่า
0.09
ว่
0.08
estrict
0.08
rằng
0.08
"*
0.07
0.07
Experimental
0.07
"
0.07
Aller
0.07
Activations Density 0.040%