INDEX
Negative Logits
ollen
-0.15
jet
-0.14
oÄį
-0.14
úc
-0.14
stag
-0.14
reon
-0.14
osc
-0.13
κά
-0.13
rac
-0.13
ne
-0.13
POSITIVE LOGITS
afen
0.17
afia
0.16
å¹
0.15
ilon
0.14
ehir
0.14
outh
0.13
zan
0.13
YSTEM
0.13
quito
0.13
epy
0.13
Activations Density 0.013%