INDEX
Negative Logits
ETYPE
-0.08
Hat
-0.07
estado
-0.06
وروب
-0.06
strup
-0.06
アルバ
-0.06
gleich
-0.06
tet
-0.06
lrt
-0.06
олит
-0.06
POSITIVE LOGITS
맡
0.07
isel
0.07
inc
0.07
brisk
0.07
ADV
0.07
ison
0.07
={()0.07
cans
0.06
ssize
0.06
<select
0.06
Activations Density 0.003%