INDEX
Negative Logits
det
-0.07
etimes
-0.06
빌
-0.06
197
-0.06
lation
-0.06
clad
-0.06
198
-0.06
'`
-0.06
Det
-0.06
rank
-0.06
POSITIVE LOGITS
ong
0.12
Gong
0.10
ONG
0.09
một
0.07
設定
0.07
/tos
0.07
ayne
0.06
bron
0.06
.grpc
0.06
republiky
0.06
Activations Density 0.003%