INDEX
Negative Logits
-0.07
Bandung
-0.07
الش
-0.07
Makeup
-0.07
ാപ്പ
-0.07
Mel
-0.07
Shu
-0.07
Mao
-0.07
impre
-0.07
-0.07
POSITIVE LOGITS
侵犯
0.13
чуж
0.10
अधिकार
0.10
invade
0.09
intrusion
0.09
invaded
0.09
invading
0.09
occupied
0.09
наруш
0.09
rechte
0.09
Activations Density 0.015%