INDEX
Explanations
food safety and regulations
New Auto-Interp
Negative Logits
的学习
0.64
战争
0.60
俦
0.60
학습
0.58
导师
0.57
学习
0.57
辏
0.56
书
0.55
辩
0.55
缚
0.54
POSITIVE LOGITS
food
1.67
food
1.63
食品
1.59
foods
1.49
식품
1.42
foods
1.40
potrav
1.39
Food
1.38
食品
1.38
alimentos
1.36
Activations Density 0.120%