INDEX
Explanations
characters and symbols in Arabic text
New Auto-Interp
Negative Logits
لينك
-0.51
ього
-0.50
ільки
-0.45
Domini
-0.44
ід
-0.44
lafen
-0.43
ниці
-0.43
leſs
-0.43
máquina
-0.42
іб
-0.42
POSITIVE LOGITS
ظة
0.54
sizeCache
0.50
))^{0.49
طة
0.49
ضة
0.49
قية
0.49
anskje
0.48
ظمة
0.48
ضير
0.47
ضية
0.47
Activations Density 0.004%