INDEX
Explanations
descriptions, characteristics
New Auto-Interp
Negative Logits
nhưng
0.31
ولكن
0.28
যখন
0.27
นั่น
0.27
azonban
0.27
那麼
0.26
però
0.26
然后
0.26
但是我
0.26
কিন্তু
0.25
POSITIVE LOGITS
includes
0.36
merupakan
0.34
erdapat
0.32
Includes
0.31
دارای
0.31
incluye
0.30
является
0.28
umfasst
0.28
represents
0.28
ちなみに
0.28
Activations Density 3.587%