INDEX
Explanations
pronoun followed by prepositions
New Auto-Interp
Negative Logits
cuja
0.23
memungkinkan
0.22
telah
0.22
-
0.22
elucid
0.21
<0x8A>
0.21
misappropri
0.21
volontà
0.21
är
0.20
została
0.20
POSITIVE LOGITS
in
0.32
в
0.23
جميعا
0.23
在
0.23
on
0.22
c
0.20
from
0.20
俩
0.19
;
0.19
at
0.18
Activations Density 0.450%