INDEX
Negative Logits
Rede
-0.09
Fue
-0.08
blind
-0.08
Rede
-0.08
permeability
-0.08
Fue
-0.08
وو
-0.08
сред
-0.07
timmar
-0.07
પૂર
-0.07
POSITIVE LOGITS
server
0.08
c
0.07
каж
0.07
chr
0.07
potent
0.07
ŷ
0.07
cene
0.07
akin
0.07
nomen
0.07
cac
0.07
Activations Density 0.002%