INDEX
Explanations
the particle "で," indicating locations or means in sentences
New Auto-Interp
Negative Logits
"];
-0.70
يتيمه
-0.68
Holtz
-0.64
什么呢
-0.62
見えない
-0.62
見えます
-0.61
Datuak
-0.60
iſt
-0.60
はこんな感じ
-0.57
ſhip
-0.57
POSITIVE LOGITS
で
3.51
で
2.36
でお
1.73
で大
1.71
りで
1.68
でも
1.63
では
1.62
などで
1.61
にて
1.53
での
1.50
Activations Density 0.015%