INDEX
Negative Logits
hour
-0.08
ational
-0.08
hour
-0.08
chain
-0.07
Over
-0.07
Chain
-0.07
Cannot
-0.07
Hour
-0.07
ryg
-0.07
DUR
-0.07
POSITIVE LOGITS
滴
0.09
詢
0.09
閱
0.09
忙
0.08
عباس
0.08
污
0.08
更新
0.08
گیر
0.08
usses
0.08
说道
0.08
Activations Density 0.010%