INDEX
Negative Logits
ોથી
-0.08
iors
-0.07
Xt
-0.07
駅
-0.07
谋
-0.07
dramas
-0.07
tractor
-0.07
policial
-0.07
�
-0.07
airplanes
-0.07
POSITIVE LOGITS
एक्ट
0.09
ενεργ
0.08
(act
0.08
_act
0.08
.act
0.08
ār
0.08
Carn
0.08
annum
0.08
Carn
0.08
PAG
0.08
Activations Density 0.298%