INDEX
Explanations
wanting or needing something
New Auto-Interp
Negative Logits
問題
0.43
情形
0.42
柛
0.41
وال
0.41
کچھ
0.40
これも
0.40
καν
0.40
相當
0.39
Meanwhile
0.38
Previously
0.38
POSITIVE LOGITS
wants
0.57
desires
0.55
ต้องการ
0.53
needs
0.51
ต้องการ
0.51
хоче
0.50
chcesz
0.50
voit
0.49
vuoi
0.49
necesitas
0.48
Activations Density 0.001%