INDEX
Negative Logits
ков
0.61
认为
0.56
خ
0.56
რა
0.54
Dier
0.54
似乎
0.52
是要
0.51
ਡ
0.50
ਹ
0.50
기존
0.50
POSITIVE LOGITS
ate
0.61
estudios
0.59
ih
0.56
id
0.56
iation
0.55
able
0.55
ik
0.55
ال
0.55
ala
0.55
oras
0.54
Activations Density 0.013%
ков
认为
خ
რა
Dier
似乎
是要
ਡ
ਹ
기존
ate
estudios
ih
id
iation
able
ik
ال
ala
oras