INDEX
Negative Logits
teen
-0.09
ayya
-0.08
unpopular
-0.08
汉
-0.08
汉
-0.08
漢
-0.07
réun
-0.07
intro
-0.07
benches
-0.07
.end
-0.07
POSITIVE LOGITS
منظور
0.08
έναν
0.08
മ
0.08
ег
0.07
ب
0.07
فرمای
0.07
اشاره
0.07
ortis
0.07
ğinde
0.07
когато
0.07
Activations Density 0.009%