INDEX
Negative Logits
AK
1.46
它
1.46
tellers
1.45
于是
1.38
OUT
1.22
atures
1.21
sticks
1.20
AKT
1.20
مطرح
1.19
𝐖
1.19
POSITIVE LOGITS
т
1.48
क
1.45
近い
1.35
inė
1.33
ية
1.31
ir
1.27
けた
1.26
σό
1.26
ल
1.25
কিন্ত
1.24
Activations Density 0.006%
AK
它
tellers
于是
OUT
atures
sticks
AKT
مطرح
𝐖
т
क
近い
inė
ية
ir
けた
σό
ल
কিন্ত