INDEX
Explanations
closing quotation marks and affirmations
New Auto-Interp
Negative Logits
whitespace
0.46
SnackBar
0.45
markdown
0.43
يران
0.42
使其
0.42
avoids
0.40
候
0.40
membuatnya
0.39
alphan
0.39
ที่คุณ
0.39
POSITIVE LOGITS
Indeed
0.72
Indeed
0.68
indeed
0.63
确实
0.59
的确
0.57
indeed
0.55
memang
0.54
確實
0.50
وأضاف
0.49
действительно
0.49
Activations Density 0.002%