INDEX
Negative Logits
埋
-0.07
μί
-0.07
پدر
-0.06
dân
-0.06
uação
-0.06
nửa
-0.06
shuffled
-0.06
犯罪
-0.06
-election
-0.06
quá
-0.06
POSITIVE LOGITS
.sections
0.07
;'↵
0.07
USING
0.07
Woj
0.06
کوچ
0.06
维
0.06
tarz
0.06
.col
0.06
Warm
0.06
LAB
0.06
Activations Density 0.025%