INDEX
Negative Logits
cdr
-0.07
beiten
-0.06
ڣ
-0.06
преимуществ
-0.06
⚲
-0.06
ニュー
-0.06
poo
-0.06
Tüm
-0.06
曾經
-0.06
릳
-0.06
POSITIVE LOGITS
vent
0.07
とう
0.07
עליו
0.07
帮他
0.07
_selector
0.07
ylon
0.07
ألو
0.07
וקר
0.07
QL
0.06
validation
0.06
Activations Density 0.148%