INDEX
Negative Logits
asg
-0.09
ugn
-0.08
gevolg
-0.07
переб
-0.07
États
-0.07
பற்ற
-0.07
衛
-0.07
VIA
-0.07
நில
-0.07
欠
-0.07
POSITIVE LOGITS
GPT
0.09
помощ
0.08
Cop
0.08
USERNAME
0.08
Deep
0.08
Assistant
0.08
λαν
0.07
Parser
0.07
Parser
0.07
Interp
0.07
Activations Density 0.018%