INDEX
Negative Logits
phénom
-0.08
عين
-0.08
அறிவ
-0.07
-0.07
crime
-0.07
Demand
-0.07
அதிகார
-0.07
ಾರ್ಥ
-0.07
Sessions
-0.07
明星
-0.07
POSITIVE LOGITS
掉
0.09
损
0.08
integrity
0.08
can't
0.08
corrupt
0.08
recovery
0.08
recover
0.08
damaged
0.08
irre
0.08
造成
0.08
Activations Density 0.036%