INDEX
Negative Logits
cif
-0.08
cob
-0.08
goodness
-0.08
viol
-0.08
SCI
-0.08
dose
-0.08
Jack
-0.08
Cob
-0.08
dream
-0.07
Cit
-0.07
POSITIVE LOGITS
あります
0.10
iris
0.08
కలిసి
0.08
ring
0.08
ので
0.08
Guth
0.07
ಇದೇ
0.07
sta
0.07
लगे
0.07
ғд
0.07
Activations Density 0.005%