INDEX
Negative Logits
ников
-0.08
VC
-0.07
bal
-0.07
misc
-0.07
615
-0.07
multip
-0.07
típico
-0.07
שת
-0.07
stole
-0.07
violates
-0.07
POSITIVE LOGITS
照
0.08
系统
0.08
欢迎
0.08
官网
0.08
谱
0.08
രോ
0.08
ированной
0.08
축
0.08
ao
0.07
allo
0.07
Activations Density 0.004%