INDEX
Explanations
No Explanations Found
New Auto-Interp
Negative Logits
as
1.63
า
1.63
ia
1.50
us
1.31
ay
1.27
im
1.25
ara
1.20
ere
1.17
á
1.16
at
1.14
POSITIVE LOGITS
ي
1.66
。
1.27
ني
1.20
۔
1.19
في
1.17
يان
1.16
נ
1.15
اي
1.13
។
1.13
تي
1.11
Activations Density 0.000%