INDEX
Negative Logits
别人
-0.08
Loren
-0.08
spur
-0.08
ательная
-0.07
horn
-0.07
Fähigkeit
-0.07
ロ
-0.07
horn
-0.07
로
-0.07
Lanka
-0.07
POSITIVE LOGITS
Boss
0.08
asc
0.07
eliness
0.07
clerk
0.07
Schwartz
0.07
zodat
0.07
numer
0.07
quier
0.07
sûr
0.07
সংখ্য
0.07
Activations Density 0.001%