INDEX
Negative Logits
子的
-0.08
극
-0.08
advertised
-0.08
નહિ
-0.08
ieres
-0.08
_given
-0.08
아니라
-0.07
नहीं
-0.07
ไม่
-0.07
(IR
-0.07
POSITIVE LOGITS
bri
0.11
esimerkiksi
0.10
puntual
0.08
ucose
0.08
lah
0.08
've
0.08
progrès
0.07
ої
0.07
River
0.07
<head
0.07
Activations Density 0.049%