INDEX
Negative Logits
Hos
-0.09
�
-0.08
NAB
-0.08
ज्ञान
-0.08
العليا
-0.08
stabbing
-0.08
Dy
-0.08
tring
-0.07
sec
-0.07
aum
-0.07
POSITIVE LOGITS
113
0.07
114
0.07
Hollywood
0.07
-то
0.07
ਮ
0.07
بح
0.07
Gary
0.07
wildly
0.07
conflitos
0.07
碎
0.07
Activations Density 0.015%