INDEX
Negative Logits
lam
-0.08
PPE
-0.07
Chang
-0.07
renomm
-0.07
(OP
-0.07
.sel
-0.07
நீ
-0.07
ிப்
-0.07
Tol
-0.07
correct
-0.07
POSITIVE LOGITS
অনুভ
0.09
աջ
0.08
byg
0.08
কম
0.08
হও
0.08
գալ
0.08
եհ
0.08
komen
0.08
বজ
0.08
महसूस
0.08
Activations Density 0.004%