INDEX
Negative Logits
bert
-0.08
针对
-0.08
WEST
-0.07
tərə
-0.07
cual
-0.07
िने
-0.07
Angle
-0.07
Def
-0.07
iple
-0.07
NE
-0.07
POSITIVE LOGITS
interconnected
0.15
அனைவர
0.14
എല്ലാവ
0.12
everyone
0.11
সবাই
0.11
皆
0.10
الجميع
0.10
everyone's
0.10
kaikk
0.10
大家
0.10
Activations Density 0.034%