INDEX
Explanations
verbs indicating action and change
New Auto-Interp
Negative Logits
বলিতে
0.48
ўна
0.46
𒌅
0.46
chamar
0.45
蹌
0.45
ಹಾಸ
0.44
parvec
0.44
ನದ
0.44
ைகளைப்
0.44
癀
0.44
POSITIVE LOGITS
する
1.23
하는
1.12
された
1.02
した
1.01
している
0.92
된
0.92
される
0.91
하기
0.91
して
0.89
します
0.89
Activations Density 0.001%