INDEX
Negative Logits
ampl
-0.07
Merge
-0.06
glasses
-0.06
juste
-0.06
冲
-0.06
.ant
-0.06
softly
-0.06
Differential
-0.06
beams
-0.06
پرداخت
-0.06
POSITIVE LOGITS
wal
0.07
tls
0.06
ban
0.06
şey
0.06
Tek
0.06
đàn
0.06
시아
0.06
383
0.06
πρω
0.06
Trout
0.06
Activations Density 0.051%