INDEX
Negative Logits
Ping
-0.08
Phoenix
-0.08
Connect
-0.07
Topic
-0.07
门前
-0.07
喟
-0.07
神
-0.07
runs
-0.07
一刻
-0.07
onio
-0.07
POSITIVE LOGITS
Ⓖ
0.08
działal
0.07
.Obj
0.07
_corpus
0.07
שקל
0.07
объя
0.07
隐身
0.07
sä
0.07
虸
0.07
sliced
0.07
Activations Density 0.019%