INDEX
Negative Logits
arah
0.42
ження
0.41
硃
0.40
ہور
0.40
फड
0.38
발
0.38
ಎಸ್
0.38
مدار
0.36
夂
0.36
वैदिक
0.35
POSITIVE LOGITS
denominator
0.39
สำหรับการ
0.37
নিরস্ত্র
0.37
sendKeyDown
0.37
কী
0.36
தியும்
0.36
চালাতে
0.35
sleek
0.34
things
0.34
Keith
0.33
Activations Density 0.001%