INDEX
Negative Logits
인증
-0.08
crawl
-0.08
刺
-0.07
errat
-0.07
Higgins
-0.07
televizyon
-0.07
인증
-0.07
hysteria
-0.06
Hamp
-0.06
Zend
-0.06
POSITIVE LOGITS
Po
0.16
Po
0.15
po
0.13
PO
0.12
po
0.11
PO
0.11
-po
0.10
poets
0.09
poet
0.09
.PO
0.09
Activations Density 0.018%