INDEX
Explanations
affirmative statements about existence or qualities of subjects
New Auto-Interp
Negative Logits
出版年
-0.78
muualla
-0.74
reafon
-0.64
Efq
-0.64
faſt
-0.61
Ведь
-0.61
transfieras
-0.61
ETHING
-0.59
estekak
-0.59
multer
-0.58
POSITIVE LOGITS
でございます
0.56
SIMBAD
0.54
あります
0.54
おります
0.54
shall
0.53
hoffen
0.52
öv
0.52
是非常
0.52
ございます
0.51
ásban
0.51
Activations Density 0.130%