INDEX
Negative Logits
الفور
0.45
hacerlo
0.42
したり
0.41
correspondingly
0.40
також
0.39
потім
0.39
później
0.39
также
0.39
робнее
0.39
نیز
0.39
POSITIVE LOGITS
accidentally
0.79
discovers
0.71
suddenly
0.70
desperately
0.69
tasked
0.65
hired
0.63
woke
0.63
случайно
0.62
menemukan
0.62
shipwreck
0.61
Activations Density 0.032%