INDEX
Negative Logits
ụgbọ
-0.08
ッチ
-0.07
uru
-0.07
ум
-0.07
Julio
-0.07
gir
-0.07
ยม
-0.07
excit
-0.07
delt
-0.07
ọgụ
-0.07
POSITIVE LOGITS
Disk
0.08
WF
0.07
_disk
0.07
surfing
0.07
Sham
0.07
Dar
0.07
inflammatory
0.07
ce
0.07
ian
0.07
pour
0.07
Activations Density 0.002%