INDEX
Negative Logits
говой
0.44
戴
0.44
មើ
0.43
ाइन
0.39
Interfaces
0.39
наличи
0.39
ご理解
0.39
एशन
0.38
FROM
0.37
обычной
0.37
POSITIVE LOGITS
languages
0.57
Sprachen
0.57
знако
0.53
lingue
0.52
방법을
0.51
histoires
0.50
dialects
0.49
języ
0.49
পারে
0.48
idioma
0.47
Activations Density 0.067%