INDEX
Negative Logits
+.
1.60
.).
1.45
.",
1.44
。
1.43
).
1.41
:).
1.40
++.
1.38
.");
1.37
*.
1.35
!.
1.34
POSITIVE LOGITS
者は
1.15
色は
1.14
目的是
1.13
方法は
1.11
情報は
1.07
部分は
1.03
率は
1.02
さは
1.01
人は
0.98
상은
0.97
Activations Density 0.316%
+.
.).
.",
。
).
:).
++.
.");
*.
!.
者は
色は
目的是
方法は
情報は
部分は
率は
さは
人は
상은