INDEX
Negative Logits
franca
-0.09
/int
-0.08
المست
-0.07
соб
-0.07
حقيقة
-0.07
共有
-0.07
986
-0.07
主体
-0.07
̆
-0.07
ਾਵ
-0.07
POSITIVE LOGITS
Hundred
0.08
उससे
0.08
ijden
0.08
ಐ
0.08
कदम
0.07
HAL
0.07
φαν
0.07
assumed
0.07
ഘ
0.07
gangen
0.07
Activations Density 0.002%