INDEX
Negative Logits
文物
0.41
abstracts
0.40
📼
0.38
ពេ
0.37
媜
0.37
subscribed
0.36
छठी
0.36
🔟
0.35
🍘
0.35
whor
0.35
POSITIVE LOGITS
tikzpicture
0.77
Tik
0.73
tikz
0.68
Tik
0.64
tik
0.62
lua
0.60
TikTok
0.57
tik
0.56
TikTok
0.53
documentclass
0.52
Activations Density 0.006%