INDEX
Explanations
bullet points or list items in instructional or procedural text
New Auto-Interp
Negative Logits
Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł
-0.15
↵ ↵
-0.14
Ñ
-0.14
pronto
-0.14
Ł
-0.14
ilk
-0.14
Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł
-0.14
çĶ
-0.14
moon
-0.13
Partial
-0.13
POSITIVE LOGITS
0.31
↵ ↵
0.27
The
0.24
f
0.24
d
0.24
m
0.24
s
0.23
M
0.23
S
0.23
b
0.23
Activations Density 0.876%