INDEX
Negative Logits
ë¸
-0.09
åĹ¯
-0.09
Fucked
-0.09
paz
-0.08
ond
-0.08
GF
-0.08
toy
-0.08
motion
-0.08
damned
-0.08
backs
-0.08
POSITIVE LOGITS
goodness
0.14
gracious
0.13
sake
0.13
stars
0.12
holy
0.12
oly
0.11
oh
0.11
Budd
0.10
Holy
0.10
оже
0.10
Activations Density 0.044%