INDEX
Negative Logits
tn
-0.09
.Match
-0.08
ey
-0.07
alars
-0.07
uw
-0.07
getitem
-0.07
nj
-0.07
λυ
-0.07
sg
-0.07
จำ
-0.07
POSITIVE LOGITS
onomie
0.09
饭
0.09
Stern
0.08
Philosoph
0.08
灯
0.08
飯
0.08
ících
0.08
seguida
0.08
aming
0.08
帰
0.08
Activations Density 0.021%