INDEX
Negative Logits
<0x0D>
0.55
'-')
0.50
limp
0.49
inins
0.47
in
0.47
don
0.47
merged
0.46
ERK
0.46
nt
0.46
some
0.45
POSITIVE LOGITS
Гра
0.57
ვი
0.56
لأ
0.52
Virology
0.52
Γερμαν
0.52
виль
0.50
помощ
0.50
ধার
0.50
něm
0.49
Schauspiel
0.49
Activations Density 0.000%