INDEX
Negative Logits
Ultra
-0.09
ultra
-0.08
Feedback
-0.08
草
-0.07
heb
-0.07
briefing
-0.07
Leadership
-0.07
Ultra
-0.07
berd
-0.07
Archbishop
-0.07
POSITIVE LOGITS
STE
0.08
diag
0.08
goto
0.08
ído
0.08
spa
0.08
übernommen
0.08
炸
0.08
ρες
0.08
ларда
0.08
zott
0.08
Activations Density 0.048%