INDEX
Explanations
boolean expressions indicating truth values
New Auto-Interp
Negative Logits
gồm
-0.50
degli
-0.45
متعلقه
-0.45
()}>
-0.45
multi
-0.44
itosti
-0.44
いていた
-0.44
なんだろう
-0.44
about
-0.44
sság
-0.43
POSITIVE LOGITS
true
1.09
true
1.09
False
1.05
True
0.97
stdbool
0.96
TRUE
0.92
false
0.90
False
0.87
TRUE
0.85
True
0.84
Activations Density 0.135%