INDEX
Negative Logits
[val
-0.08
playoffs
-0.07
Main
-0.07
type
-0.06
Business
-0.06
truth
-0.06
隐藏
-0.06
.DialogInterface
-0.06
Arr
-0.06
[str
-0.06
POSITIVE LOGITS
��
0.09
蒂
0.07
μή
0.07
GU
0.07
ΑΠ
0.07
HI
0.06
зависим
0.06
собою
0.06
mutlu
0.06
タン
0.06
Activations Density 0.056%