INDEX
Explanations
describing quality or state
New Auto-Interp
Negative Logits
waardoor
0.46
wodurch
0.46
ermöglicht
0.46
permettent
0.44
iteits
0.44
recogn
0.41
plemente
0.41
造成的
0.41
とはいえ
0.41
menyebabkan
0.40
POSITIVE LOGITS
பெரும்பாலும்
0.54
غال
0.51
کمتر
0.50
अक्सर
0.48
controversial
0.46
generalmente
0.46
genellikle
0.44
بیشتر
0.43
ఎక్కువగా
0.43
చాలా
0.42
Activations Density 0.072%