INDEX
Explanations
references to quantities related to the number 80 and its significance
New Auto-Interp
Negative Logits
finder
-0.17
leÅŁik
-0.16
allon
-0.16
usc
-0.16
one
-0.15
iard
-0.15
/Edit
-0.15
orch
-0.15
133
-0.15
दर
-0.14
POSITIVE LOGITS
een
0.22
als
0.21
eenth
0.20
nÃŃ
0.19
ãģªãģı
0.19
/un
0.17
_WAKE
0.16
ermen
0.16
ı
0.16
ments
0.15
Activations Density 0.131%