INDEX
Negative Logits
-0.08
atorial
-0.08
pecific
-0.07
ymmetric
-0.07
avg
-0.07
.ck
-0.07
Stabil
-0.07
liking
-0.07
THE
-0.07
ero
-0.07
POSITIVE LOGITS
�ট
0.10
خر
0.09
Temporary
0.09
�ვ
0.09
�այ
0.08
�
0.08
jotta
0.08
الخر
0.08
ուշ
0.08
�ნ
0.08
Activations Density 0.005%