INDEX
Explanations
interrogative words and phrases
New Auto-Interp
Negative Logits
-2.69
。「
-2.52
<td>
-2.42
趼
-2.41
",
-2.39
todėl
-2.34
廕
-2.33
</b>
-2.30
谖
-2.30
i
-2.28
POSITIVE LOGITS
</em>
2.86
</strong>
2.50
~
2.41
みると
2.41
有不少
2.38
齶
2.36
</h3>
2.34
見ると
2.27
見ても
2.27
什么的
2.19
Activations Density 0.002%