INDEX
Explanations
positive descriptive adjectives
New Auto-Interp
Negative Logits
infección
0.46
Normally
0.41
少なくとも
0.40
এরূপ
0.39
ejec
0.39
লোকদের
0.39
antecedentes
0.38
低い
0.38
infecciones
0.38
Considerando
0.38
POSITIVE LOGITS
atyp
0.63
sublim
0.61
sublime
0.57
plaisir
0.57
issime
0.57
dévo
0.57
conviv
0.55
idéale
0.55
indispensables
0.54
douceur
0.54
Activations Density 0.008%