INDEX
Explanations
AI assisted or attacker action
New Auto-Interp
Negative Logits
Social
0.43
Years
0.43
Flood
0.43
Genealogy
0.42
Life
0.41
زندگی
0.41
这是
0.40
الحياة
0.40
Social
0.39
ົດ
0.38
POSITIVE LOGITS
短
0.43
fewer
0.42
উপস্থিতি
0.42
thinking
0.41
krótk
0.41
brainstorming
0.40
enseignants
0.40
regular
0.39
மாணவர்கள்
0.38
eas
0.38
Activations Density 0.005%