INDEX
Negative Logits
ourt
-0.08
ircle
-0.08
7
-0.08
돌
-0.07
insisting
-0.07
olum
-0.07
Louis
-0.07
sorting
-0.07
fort
-0.06
Gul
-0.06
POSITIVE LOGITS
cache
0.12
Cache
0.11
Cache
0.10
cache
0.09
cache
0.09
CACHE
0.09
CHE
0.08
ach
0.08
_CACHE
0.08
.cache
0.08
Activations Density 0.008%