INDEX
Negative Logits
Amt
-0.07
Vent
-0.07
Clinton
-0.07
日本人
-0.07
san
-0.07
Пер
-0.07
cuador
-0.06
ꪻ
-0.06
angrily
-0.06
整個
-0.06
POSITIVE LOGITS
bool
0.08
*}
0.07
beit
0.07
bias
0.07
诬
0.07
iane
0.07
יח
0.07
homelessness
0.07
によ
0.07
trebuie
0.07
Activations Density 0.010%