INDEX
Negative Logits
تويتر
-0.08
눅
-0.07
等到
-0.07
vor
-0.06
😠
-0.06
licting
-0.06
شد
-0.06
ederation
-0.06
ầm
-0.06
شت
-0.06
POSITIVE LOGITS
החלט
0.07
憕
0.07
推开
0.07
ENCH
0.07
Dominican
0.07
ﹻ
0.07
Yorkers
0.06
layui
0.06
İki
0.06
(ent
0.06
Activations Density 0.001%