INDEX
Explanations
quantitative measurements and time references
New Auto-Interp
Negative Logits
šaty
-0.55
dėl
-0.49
conozco
-0.46
Kartoffeln
-0.44
veľa
-0.44
afbeeldingen
-0.43
banyak
-0.43
kebanyakan
-0.43
pikiran
-0.43
meeste
-0.42
POSITIVE LOGITS
ſta
0.65
faſt
0.63
ſch
0.62
GEBURTS
0.57
nanot
0.57
kilometre
0.57
ſte
0.56
metre
0.56
ThroughAttribute
0.55
checklist
0.54
Activations Density 0.292%