INDEX
Explanations
chooses, decides, takes, uses
New Auto-Interp
Negative Logits
являются
0.41
является
0.38
။
0.38
είναι
0.36
appartiennent
0.34
都是
0.34
হলো
0.34
เป็น
0.33
belong
0.33
:
0.33
POSITIVE LOGITS
chose
0.53
chooses
0.50
gunakan
0.47
bruke
0.46
bruge
0.45
take
0.43
выбира
0.43
ṣe
0.42
puts
0.42
decides
0.42
Activations Density 0.096%