INDEX
Negative Logits
。
0.27
。",
0.22
;
0.20
។
0.19
;
0.18
which
0.18
().
0.18
والذي
0.18
(),
0.18
。\
0.18
POSITIVE LOGITS
advice
0.24
insight
0.23
ное
0.23
predic
0.22
guidance
0.22
supporto
0.22
support
0.21
insights
0.21
credence
0.21
prompt
0.21
Activations Density 0.337%