INDEX
Negative Logits
ola
-0.07
ela
-0.07
olle
-0.07
Cake
-0.07
kro
-0.07
Wolf
-0.07
Saga
-0.07
Daw
-0.07
kla
-0.07
ule
-0.07
POSITIVE LOGITS
int
0.12
int
0.11
,int
0.11
(int
0.11
int
0.10
(INT
0.09
=int
0.09
Int
0.09
<int
0.09
_int
0.08
Activations Density 0.037%