INDEX
Negative Logits
tp
-0.08
tp
-0.08
прет
-0.08
andoff
-0.08
716
-0.07
ಾನ
-0.07
Werk
-0.07
precedent
-0.07
ليق
-0.07
Wild
-0.07
POSITIVE LOGITS
Sz
0.08
വിവിധ
0.08
/her
0.08
ورب
0.07
autonom
0.07
Sz
0.07
Fähigkeit
0.07
நடை
0.07
Squ
0.07
عداد
0.07
Activations Density 0.008%