INDEX
Negative Logits
㤓
0.44
ということです
0.42
最早
0.41
siis
0.41
کرل
0.39
Итак
0.39
综
0.39
λοι
0.38
tehát
0.38
Firstly
0.37
POSITIVE LOGITS
हम
0.81
мы
0.80
আমরা
0.74
we
0.73
我們
0.72
हमने
0.66
我们也
0.66
here
0.66
我们
0.64
نحن
0.63
Activations Density 0.007%
㤓
ということです
最早
siis
کرل
Итак
综
λοι
tehát
Firstly
हम
мы
আমরা
we
我們
हमने
我们也
here
我们
نحن