INDEX
Explanations
possessive prepositions and suffixes
New Auto-Interp
Negative Logits
lesquelles
0.26
гуляць
0.25
komm
0.25
pretending
0.25
lesquels
0.25
allez
0.25
بیچ
0.24
naprawdę
0.24
можливість
0.24
regation
0.23
POSITIVE LOGITS
của
0.49
των
0.44
của
0.40
של
0.37
ของ
0.37
នៃ
0.37
της
0.35
του
0.33
ของการ
0.32
dello
0.31
Activations Density 0.066%