INDEX
Negative Logits
所以
0.43
ну
0.39
↵↵
0.39
никак
0.39
ed
0.38
Examples
0.38
암
0.38
माफ
0.38
0.37
ότι
0.37
POSITIVE LOGITS
డాది
0.51
üler
0.48
montaña
0.47
hareket
0.46
wallepics
0.45
alquiler
0.45
mladi
0.45
priprav
0.45
الحركه
0.44
سوریه
0.43
Activations Density 0.001%