INDEX
Negative Logits
יור
-0.09
yell
-0.08
nja
-0.08
NK
-0.08
kab
-0.08
苗
-0.08
油
-0.08
্ছ
-0.07
yen
-0.07
הול
-0.07
POSITIVE LOGITS
Note
0.08
Note
0.08
note
0.08
нес
0.07
0.07
formal
0.07
Formal
0.07
note
0.07
Toul
0.07
NOTE
0.07
Activations Density 0.024%