INDEX
Negative Logits
clustering
-0.07
oodoo
-0.07
DOT
-0.07
idding
-0.07
Brendan
-0.06
ाश
-0.06
GOR
-0.06
Kuwait
-0.06
nghi
-0.06
행동
-0.06
POSITIVE LOGITS
violin
0.09
viol
0.07
Fellow
0.06
hil
0.06
hợp
0.06
flag
0.06
_triangle
0.06
colon
0.06
_addr
0.06
(inst
0.06
Activations Density 0.014%