INDEX
Negative Logits
DF
-0.08
otos
-0.07
еле
-0.06
wl
-0.06
RELEASE
-0.06
ández
-0.06
Elliot
-0.06
ähr
-0.06
uche
-0.06
Rot
-0.06
POSITIVE LOGITS
Lou
0.07
dışarı
0.06
plat
0.06
.am
0.06
่ำ
0.06
κα
0.06
่ใช
0.06
nk
0.06
bookmark
0.06
"?>↵
0.06
Activations Density 0.036%