INDEX
Negative Logits
服务区
-0.08
Republic
-0.07
3
-0.07
WikiLeaks
-0.07
ものを
-0.07
Courtesy
-0.07
grapes
-0.07
province
-0.07
권리
-0.06
Embassy
-0.06
POSITIVE LOGITS
.validators
0.07
a
0.07
and
0.07
секрет
0.07
_ISR
0.07
educ
0.06
Educational
0.06
""".
0.06
_off
0.06
лем
0.06
Activations Density 0.018%