INDEX
Negative Logits
caler
-0.08
belle
-0.07
iscal
-0.07
歷
-0.07
Noah
-0.07
llu
-0.07
istol
-0.07
Billy
-0.07
raffin
-0.07
কদের
-0.07
POSITIVE LOGITS
MAS
0.08
manganese
0.07
Proto
0.07
elho
0.07
Used
0.07
rar
0.07
CAN
0.07
Bad
0.07
articol
0.07
Apart
0.07
Activations Density 0.001%