INDEX
Negative Logits
oons
-0.08
بده
-0.08
bied
-0.08
娘
-0.08
contam
-0.08
denke
-0.08
denken
-0.08
halo
-0.08
propulsion
-0.07
degrading
-0.07
POSITIVE LOGITS
.P
0.08
P
0.08
-P
0.08
öpf
0.08
Patrick
0.08
Caller
0.07
Fidel
0.07
方案
0.07
-level
0.07
Signature
0.07
Activations Density 0.001%