INDEX
Negative Logits
1
0.29
?
0.28
ले
0.27
!
0.27
on
0.26
taker
0.26
芋
0.25
กัน
0.25
نا
0.25
ت
0.24
POSITIVE LOGITS
工程师
0.27
મ
0.27
Year
0.26
ことにより
0.26
songwriter
0.26
ъ
0.25
𝗈
0.25
الذين
0.25
c
0.25
ទទួល
0.25
Activations Density 0.259%
1
?
ले
!
on
taker
芋
กัน
نا
ت
工程师
મ
Year
ことにより
songwriter
ъ
𝗈
الذين
c
ទទួល