INDEX
Negative Logits
azonban
0.21
Однако
0.18
sogenannten
0.18
しかし
0.17
অবশ্য
0.17
でしたが
0.17
:
0.17
However
0.17
நடைபெற்ற
0.17
använder
0.17
POSITIVE LOGITS
makes
0.23
hurts
0.21
realmente
0.20
proves
0.19
justifies
0.19
really
0.19
Makes
0.19
vraiment
0.19
underval
0.19
justify
0.19
Activations Density 1.078%