INDEX
Negative Logits
.song
-0.09
폭
-0.07
Fol
-0.07
Jung
-0.07
Sorry
-0.07
った
-0.07
grind
-0.07
J
-0.07
jou
-0.07
.fore
-0.07
POSITIVE LOGITS
policymakers
0.08
внимания
0.08
lima
0.08
اع
0.07
profess
0.07
Lima
0.07
atrib
0.07
chr
0.07
حاس
0.07
bac
0.07
Activations Density 0.088%