INDEX
Negative Logits
geben
-0.09
ಕರ
-0.08
rome
-0.08
komun
-0.08
wisdom
-0.08
-organ
-0.07
ಾ
-0.07
adakan
-0.07
get
-0.07
men
-0.07
POSITIVE LOGITS
deprivation
0.08
cimento
0.07
_OCC
0.07
tiring
0.07
privation
0.07
另类
0.07
કેવી
0.07
الحيو
0.07
पहन
0.07
Occup
0.07
Activations Density 0.001%