INDEX
Negative Logits
concord
-0.10
례
-0.08
ึก
-0.08
舞
-0.07
flores
-0.07
謝
-0.07
Plat
-0.07
Angry
-0.07
這
-0.07
Ul
-0.07
POSITIVE LOGITS
stout
0.08
folio
0.07
усил
0.07
आयोग
0.07
duk
0.07
redu
0.07
danger
0.07
constructed
0.07
Stu
0.07
구축
0.07
Activations Density 0.002%