INDEX
Negative Logits
statutory
-0.08
Vorder
-0.08
fuck
-0.08
suburb
-0.07
Residential
-0.07
-ext
-0.07
Gang
-0.07
secure
-0.07
-0.07
south
-0.07
POSITIVE LOGITS
للا
0.08
tours
0.08
piv
0.08
Ї
0.08
perme
0.08
漂
0.08
উ
0.07
owych
0.07
体系
0.07
名称
0.07
Activations Density 0.001%