INDEX
Negative Logits
equilibria
0.84
reassure
0.67
reassuring
0.67
gou
0.66
unassuming
0.66
summers
0.65
judicious
0.65
equilibration
0.63
nonchal
0.63
greeted
0.62
POSITIVE LOGITS
впервые
2.42
erstmals
2.02
প্রথমবারের
1.81
初めて
1.72
首次
1.67
최초
1.43
पहली
1.40
第一次
1.36
for
1.32
unprecedented
1.30
Activations Density 0.019%