INDEX
Explanations
quantitative expressions indicating comparisons or amounts
New Auto-Interp
Negative Logits
ÑģилÑĮ
-0.08
виÑĩ
-0.07
ãģĵãĤį
-0.07
ildiÄŁi
-0.07
ãĤ¤ãĥ¤
-0.06
raig
-0.06
евеÑĢ
-0.06
iêu
-0.06
,↵↵↵↵
-0.06
__,__
-0.06
POSITIVE LOGITS
dozen
0.09
ania
0.07
700
0.06
half
0.06
hundreds
0.06
MediaQuery
0.06
ajs
0.06
yonel
0.06
pheric
0.06
lane
0.06
Activations Density 0.034%