INDEX
Negative Logits
Swimming
-0.07
一条
-0.07
bilder
-0.06
alive
-0.06
Plus
-0.06
onymous
-0.06
Bound
-0.06
乐趣
-0.06
/x
-0.06
Det
-0.06
POSITIVE LOGITS
disag
0.07
totalmente
0.07
𐭊
0.07
רא
0.07
éal
0.07
ello
0.07
esos
0.07
legislative
0.06
ملابس
0.06
_variables
0.06
Activations Density 0.037%