INDEX
Negative Logits
Thur
-0.09
induct
-0.08
apos
-0.07
�
-0.07
مص
-0.07
apr
-0.07
CX
-0.07
Mel
-0.07
�
-0.07
_sym
-0.07
POSITIVE LOGITS
bili
0.08
@g
0.08
Vene
0.08
primas
0.07
जु
0.07
கை
0.07
Patri
0.07
lis
0.07
ignition
0.07
ய
0.07
Activations Density 0.005%