INDEX
Negative Logits
בוע
-0.07
Ạ
-0.07
个多月
-0.07
spanking
-0.07
晚
-0.07
爆款
-0.07
硅谷
-0.07
大
-0.07
왕
-0.06
Pro
-0.06
POSITIVE LOGITS
eligible
0.09
eligibility
0.08
eligible
0.08
#region
0.07
----------------------------------------------------------------------------
0.07
insistence
0.07
//----------------------------------------------------------------------------
0.07
destination
0.07
cidade
0.06
・・・
0.06
Activations Density 0.004%