INDEX
Negative Logits
,”
-1.80
۱۶
-1.68
۱۳
-1.67
”),
-1.64
۱۲
-1.63
⃠
-1.63
۱۱
-1.60
۲۵
-1.59
”،
-1.59
”(
-1.59
POSITIVE LOGITS
podczas
1.91
When
1.79
knew
1.77
ubernur
1.76
しているので
1.70
Making
1.70
If
1.70
した場合
1.66
this
1.65
:
1.64
Activations Density 0.029%