INDEX
Negative Logits
изначально
0.43
선수
0.43
inine
0.41
发生了
0.41
действительно
0.41
જ્યારે
0.41
ज़ाइन
0.40
ніка
0.39
onta
0.39
לאחר
0.39
POSITIVE LOGITS
diffuse
0.48
覚
0.39
olmayan
0.38
radiating
0.38
milder
0.38
subl
0.38
nape
0.38
km
0.37
mix
0.37
ringan
0.37
Activations Density 0.013%