INDEX
Negative Logits
إب
-0.09
فع
-0.07
-minded
-0.07
থ
-0.07
مستخ
-0.07
가지
-0.07
하게
-0.07
tie
-0.07
hnliche
-0.07
hiermee
-0.07
POSITIVE LOGITS
letal
0.08
Line
0.08
RTC
0.07
/cm
0.07
ikan
0.07
señora
0.07
lying
0.07
/top
0.07
Mald
0.07
Line
0.07
Activations Density 0.002%