INDEX
Negative Logits
ITTE
-0.07
перек
-0.06
문화
-0.06
航
-0.06
Watching
-0.06
hiking
-0.06
ed
-0.06
sustainability
-0.06
Arthur
-0.06
ザ
-0.06
POSITIVE LOGITS
Οι
0.07
beef
0.06
гру
0.06
рес
0.06
proletariat
0.06
sexkontakte
0.06
352
0.06
_PROC
0.06
arriv
0.06
)";↵
0.06
Activations Density 0.017%