INDEX
Explanations
foreign language verb endings
New Auto-Interp
Negative Logits
in
-1.95
from
-1.91
with
-1.79
during
-1.54
actually
-1.53
after
-1.49
on
-1.46
of
-1.41
ultimately
-1.38
at
-1.37
POSITIVE LOGITS
ようになりました
1.26
ことが多い
1.14
有一些
1.14
regra
1.13
有一個
1.13
ようになった
1.12
が可能
1.12
為に
1.10
ようになる
1.09
感じで
1.09
Activations Density 0.006%