INDEX
Explanations
No Explanations Found
New Auto-Interp
Negative Logits
أ
1.72
О
1.44
5
1.39
К
1.33
4
1.32
V
1.32
我
1.30
م
1.28
ج
1.27
大
1.26
POSITIVE LOGITS
ের
1.13
ัง
1.05
annya
1.03
al
1.02
u
1.00
x
0.97
ආහාර
0.96
kannya
0.96
τα
0.95
kka
0.95
Activations Density 0.000%