INDEX
Negative Logits
Elf
-0.07
url
-0.06
上了
-0.06
emojis
-0.06
кількості
-0.06
政治
-0.06
таблиц
-0.06
Unc
-0.06
Elves
-0.06
!="
-0.06
POSITIVE LOGITS
civilizations
0.07
intercourse
0.07
GV
0.07
coh
0.07
McCoy
0.07
.per
0.07
(stat
0.06
狀
0.06
塑
0.06
accordance
0.06
Activations Density 0.021%