INDEX
Negative Logits
polit
-0.08
illusion
-0.08
emf
-0.08
amper
-0.08
aza
-0.08
hailed
-0.07
Sehr
-0.07
architect
-0.07
IPO
-0.07
ತಿಳ
-0.07
POSITIVE LOGITS
coffee
0.08
wu
0.08
yen
0.08
青春
0.08
_FACE
0.07
прям
0.07
expr
0.07
,text
0.07
覆盖
0.07
ock
0.07
Activations Density 0.001%