INDEX
Negative Logits
_acc
-0.07
-0.07
アン
-0.06
SOME
-0.06
PC
-0.06
Ahmed
-0.06
Apellido
-0.06
оне
-0.06
с
-0.06
氏
-0.06
POSITIVE LOGITS
moth
0.07
.Boolean
0.07
letic
0.06
ellites
0.06
čist
0.06
ernote
0.06
要
0.06
릴
0.06
ρω
0.05
tiêu
0.05
Activations Density 0.044%