INDEX
Negative Logits
трябва
0.61
阍
0.60
është
0.59
должна
0.59
πρέπει
0.58
'
0.57
ラ
0.57
تكون
0.57
ẞ
0.57
𝓈
0.56
POSITIVE LOGITS
us
0.94
ul
0.61
ol
0.60
un
0.59
in
0.58
ahari
0.58
ah
0.56
az
0.56
eng
0.55
t
0.55
Activations Density 0.001%
трябва
阍
është
должна
πρέπει
'
ラ
تكون
ẞ
𝓈
us
ul
ol
un
in
ahari
ah
az
eng
t