INDEX
Explanations
numerical values, particularly related to timeframes or quantities
New Auto-Interp
Negative Logits
rait
-0.08
jte
-0.08
ushman
-0.07
ninger
-0.07
olls
-0.07
.metamodel
-0.07
мом
-0.07
treff
-0.07
jde
-0.07
deniz
-0.07
POSITIVE LOGITS
261
0.06
adas
0.06
465
0.06
ether
0.06
OnError
0.06
elo
0.06
riel
0.05
lava
0.05
726
0.05
unter
0.05
Activations Density 0.034%