INDEX
Explanations
No Explanations Found
New Auto-Interp
Negative Logits
ⅱ
0.74
攵
0.73
geqslant
0.72
oces
0.67
્ર
0.67
श्र
0.66
ຳ
0.66
ages
0.65
আশ্বাস
0.65
cud
0.65
POSITIVE LOGITS
당
1.91
당
1.65
あたり
1.64
あた
1.48
por
1.43
当たり
1.22
başına
1.19
ανά
1.12
per
1.10
દી
1.09
Activations Density 0.067%