INDEX
Explanations
"I" followed by specific punctuation or words
New Auto-Interp
Negative Logits
かもしれませんが
0.47
的一些
0.45
当然
0.44
oftentimes
0.44
perhaps
0.42
อาจ
0.40
azonban
0.40
tačiau
0.40
一些
0.39
虽然
0.39
POSITIVE LOGITS
memakai
0.44
bruke
0.40
folos
0.38
は約
0.37
bruker
0.36
koriste
0.36
terdiri
0.36
lähe
0.36
நான்கு
0.35
त्यांना
0.35
Activations Density 0.172%