INDEX
Negative Logits
ban
-0.08
abo
-0.08
Lance
-0.08
ban
-0.08
locom
-0.07
辦
-0.07
burn
-0.07
讨
-0.07
Saw
-0.07
باع
-0.07
POSITIVE LOGITS
परिच
0.08
definido
0.08
忽
0.08
endphp
0.08
unnecessarily
0.08
mary
0.08
Pref
0.08
Ak
0.08
स्वीकार
0.07
Often
0.07
Activations Density 0.006%