INDEX
Explanations
the presence of accent marks in text
New Auto-Interp
Negative Logits
N
-0.45
T
-0.45
S
-0.44
M
-0.43
C
-0.43
B
-0.43
F
-0.43
D
-0.43
A
-0.42
P
-0.41
POSITIVE LOGITS
Âł Âł Âł Âł
0.24
Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł
0.23
Âł Âł Âł Âł Âł Âł
0.23
Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł Âł
0.23
Âł
0.21
³³ ³³ ³³ ³³
0.20
³³ ³³
0.18
°C
0.17
°F
0.17
(...)↵
0.16
Activations Density 0.016%