INDEX
Negative Logits
read
1.08
write
1.04
recite
1.02
write
1.02
listen
0.99
perceive
0.95
accuse
0.95
read
0.92
cite
0.91
collaborate
0.90
POSITIVE LOGITS
Въ
0.87
Wire
0.80
кої
0.76
ског
0.76
thei
0.75
.$.
0.75
<unused544>
0.74
WIRE
0.71
Voltaire
0.69
frå
0.69
Activations Density 0.030%