INDEX
    Explanations

    describing what characterizes

    New Auto-Interp
    Negative Logits
     เพื่อ
    0.59
     обеспечения
    0.57
     الاساس
    0.55
     צריך
    0.54
     ज़रूरत
    0.54
     ควร
    0.54
     necesitamos
    0.53
    เพื่อ
    0.52
     предназна
    0.51
     काबिल
    0.51
    POSITIVE LOGITS
     characterized
    0.86
     특징
    0.84
    characterized
    0.83
    特征
    0.79
    特徴
    0.78
     characterised
    0.75
     caractér
    0.75
     характеризу
    0.75
     characteristic
    0.73
     χαρακτη
    0.72
    Act Density 0.051%

    No Known Activations