INDEX
Negative Logits
gebn
-0.07
_Att
-0.07
buff
-0.07
contends
-0.06
Andrea
-0.06
Attr
-0.06
ENTIC
-0.06
Lexer
-0.06
chị
-0.06
ds
-0.06
POSITIVE LOGITS
Royal
0.17
Royal
0.15
royal
0.11
al
0.09
ал
0.08
IAL
0.08
Royals
0.08
ral
0.08
Youtube
0.08
oliberal
0.08
Activations Density 0.005%