INDEX
Negative Logits
respons
-0.08
arab
-0.08
obe
-0.08
worthiness
-0.07
worst
-0.07
entre
-0.07
ನಡೆಸ
-0.07
lider
-0.07
htar
-0.07
terreno
-0.07
POSITIVE LOGITS
公式
0.09
서를
0.08
fórmula
0.08
ด้าน
0.08
सूत्र
0.08
Fór
0.08
서
0.08
spath
0.08
_pago
0.08
答案
0.08
Activations Density 0.016%