INDEX
Negative Logits
zca
-0.09
cić
-0.08
theta
-0.08
skj
-0.08
arbeiten
-0.08
znam
-0.08
bli
-0.07
сим
-0.07
column
-0.07
,.
-0.07
POSITIVE LOGITS
用
0.16
べ
0.15
材
0.15
欲
0.15
用了
0.14
物
0.13
谱
0.13
堂
0.13
용
0.13
卓
0.12
Activations Density 0.003%
zca
cić
theta
skj
arbeiten
znam
bli
сим
column
,.
用
べ
材
欲
用了
物
谱
堂
용
卓