INDEX
Explanations
phrases indicating time or context
New Auto-Interp
Negative Logits
IMA
-0.07
urum
-0.07
Slov
-0.07
ipeg
-0.06
orus
-0.06
IFY
-0.06
ima
-0.06
ÑĥÑĢÑĥ
-0.06
esp
-0.06
.ur
-0.05
POSITIVE LOGITS
aign
0.09
crest
0.07
ERSHEY
0.07
inaire
0.07
presently
0.07
_tD
0.06
ement
0.06
üç
0.06
zas
0.06
Ŀ
0.06
Activations Density 0.015%