INDEX
Negative Logits
y
1.20
top
1.03
t
1.02
ti
0.94
theless
0.93
ahan
0.93
tip
0.89
tis
0.89
town
0.89
ine
0.88
POSITIVE LOGITS
rumor
1.00
subpo
0.96
залиши
0.93
herring
0.93
愺
0.92
ुन
0.91
vérifier
0.91
⇰
0.90
triglycer
0.90
ំព
0.89
Activations Density 0.001%