INDEX
Explanations
when, while, cuando, during
New Auto-Interp
Negative Logits
显然
0.50
يمكن
0.49
可以让
0.48
特
0.46
ಬಹು
0.46
ممكن
0.46
Можно
0.45
可以用
0.44
特色
0.44
জ্জনক
0.44
POSITIVE LOGITS
entering
0.80
进入
0.75
進入
0.73
memasuki
0.73
entered
0.66
যখন
0.65
enters
0.64
هنگام
0.62
entering
0.59
ketika
0.57
Activations Density 0.010%