INDEX
Explanations
showering daily or regularly
New Auto-Interp
Negative Logits
리
1.02
a
0.95
다
0.95
。“
0.95
س
0.92
す
0.85
های
0.84
。”
0.82
ก็
0.82
没有
0.82
POSITIVE LOGITS
u
1.48
h
1.04
er
0.96
inizi
0.93
0.91
n
0.89
o
0.88
persönlichen
0.85
inud
0.84
w
0.82
Activations Density 0.002%