INDEX
Negative Logits
Alte
-0.08
kak
-0.08
Than
-0.07
──
-0.07
�
-0.07
Kur
-0.07
mata
-0.07
cord
-0.07
IDGE
-0.07
337
-0.07
POSITIVE LOGITS
claims
0.09
.Claims
0.09
edly
0.08
claims
0.08
claim
0.08
दावा
0.07
wng
0.07
言
0.07
প
0.07
述
0.07
Activations Density 0.023%