INDEX
Explanations
numerical data and references to publications
New Auto-Interp
Negative Logits
cheid
-0.17
²
-0.16
oleÄį
-0.16
äºĮ人
-0.15
002
-0.15
âij¡
-0.15
że
-0.15
.gwt
-0.15
two
-0.14
äºĮ
-0.14
POSITIVE LOGITS
1
0.29
ï¼ij
0.22
birinci
0.19
01
0.18
第ä¸Ģ次
0.17
bie
0.17
第ä¸Ģ
0.17
January
0.17
第ä¸Ģ
0.17
mate
0.16
Activations Density 0.043%