INDEX
Negative Logits
stark
-0.08
-0.08
gekopp
-0.08
fok
-0.07
ikka
-0.07
dùng
-0.07
দিয়ে
-0.07
verwenden
-0.07
bruge
-0.07
采用
-0.07
POSITIVE LOGITS
ဂ
0.08
Performance
0.08
puesta
0.08
Alignment
0.08
Efficiency
0.08
(env
0.08
Improvement
0.07
الأداء
0.07
desempeño
0.07
ARA
0.07
Activations Density 0.001%