INDEX
Negative Logits
(!)
-0.10
(!
-0.09
(^
-0.09
ascol
-0.08
貼
-0.08
стік
-0.08
нәр
-0.07
ларни
-0.07
-sav
-0.07
convenient
-0.07
POSITIVE LOGITS
Bigger
0.09
Relation
0.09
Cowboys
0.08
relation
0.08
《
0.08
Dragons
0.07
Tango
0.07
Trump
0.07
ufen
0.07
FEMA
0.07
Activations Density 0.048%