INDEX
Negative Logits
forn
-0.08
otov
-0.07
Roma
-0.07
Mason
-0.07
міст
-0.07
Petr
-0.07
afternoons
-0.07
pct
-0.07
pest
-0.07
Soto
-0.07
POSITIVE LOGITS
??
0.09
quelcon
0.09
Umständen
0.09
doesn't
0.08
……
0.08
вообще
0.08
什
0.08
кроме
0.08
Doesn't
0.08
…。
0.08
Activations Density 0.040%