Source code for onnx_diagnostic.torch_models.hghub.hub_data

import io
import functools
import textwrap
from typing import Dict, List

__date__ = "2025-06-21"

__data_arch_values__ = {
    "ConditionalDETRForObjectDetection": dict(image_size=224),
    "ResNetForImageClassification": dict(image_size=224),
}

__data_arch__ = textwrap.dedent("""
    architecture,task
    ASTModel,feature-extraction
    AutoencoderKL,image-to-image
    AlbertModel,feature-extraction
    BeitForImageClassification,image-classification
    BartForConditionalGeneration,summarization
    BartModel,feature-extraction
    BertForMaskedLM,fill-mask
    BertForSequenceClassification,text-classification
    BertModel,sentence-similarity
    BigBirdModel,feature-extraction
    BlenderbotModel,feature-extraction
    BloomModel,feature-extraction
    CLIPModel,zero-shot-image-classification
    CLIPTextModel,feature-extraction
    CLIPVisionModel,feature-extraction
    CamembertModel,feature-extraction
    CodeGenModel,feature-extraction
    ConvBertModel,feature-extraction
    ConvNextForImageClassification,image-classification
    ConvNextV2Model,image-feature-extraction
    CosmosTransformer3DModel,image-to-video
    CvtModel,feature-extraction
    ClvpModelForConditionalGeneration,audio-feature-extraction
    DPTModel,image-feature-extraction
    Data2VecAudioModel,feature-extraction
    Data2VecTextModel,feature-extraction
    Data2VecVisionModel,image-feature-extraction
    DebertaModel,feature-extraction
    DebertaV2Model,feature-extraction
    DecisionTransformerModel,reinforcement-learning
    DeepseekV3ForCausalLM,text-generation
    DeiTModel,image-feature-extraction
    DetrModel,image-feature-extraction
    Dinov2Model,image-feature-extraction
    DistilBertForSequenceClassification,text-classification
    DistilBertModel,feature-extraction
    DonutSwinModel,feature-extraction
    ElectraModel,feature-extraction
    EsmModel,feature-extraction
    FalconMambaForCausalLM,text-generation
    FunnelBaseModel,feature-extraction
    FuyuForCausalLM,image-text-to-text
    GLPNModel,image-feature-extraction
    GPT2LMHeadModel,text-generation
    GPTBigCodeModel,feature-extraction
    GPTJModel,feature-extraction
    GPTNeoModel,feature-extraction
    GPTNeoXForCausalLM,text-generation
    GptOssForCausalLM,text-generation
    GemmaForCausalLM,text-generation
    Gemma2ForCausalLM,text-generation
    Gemma3ForConditionalGeneration,image-text-to-text
    Gemma3ForCausalLM,text-generation
    Glm4vMoeForConditionalGeneration,image-text-to-text
    GraniteForCausalLM,text-generation
    GroupViTModel,feature-extraction
    HeliumForCausalLM,text-generation
    HieraForImageClassification,image-classification
    HubertModel,feature-extraction
    IBertModel,feature-extraction
    IdeficsForVisionText2Text,image-text-to-text
    ImageGPTModel,image-feature-extraction
    LayoutLMModel,feature-extraction
    LayoutLMv3Model,feature-extraction
    LevitModel,image-feature-extraction
    LiltModel,feature-extraction
    LlamaForCausalLM,text-generation
    LongT5Model,feature-extraction
    LongformerModel,feature-extraction
    MCTCTModel,feature-extraction
    MPNetForMaskedLM,sentence-similarity
    MPNetModel,feature-extraction
    MT5Model,feature-extraction
    MarianMTModel,text2text-generation
    MarkupLMModel,feature-extraction
    MaskFormerForInstanceSegmentation,image-segmentation
    MegatronBertModel,feature-extraction
    MgpstrForSceneTextRecognition,feature-extraction
    MistralForCausalLM,text-generation
    MobileBertModel,feature-extraction
    MobileNetV1Model,image-feature-extraction
    MobileNetV2Model,image-feature-extraction
    mobilenetv3_small_100,image-classification
    MobileViTForImageClassification,image-classification
    ModernBertForMaskedLM,fill-mask
    Phi4MMForCausalLM,MoE
    MoonshineForConditionalGeneration,automatic-speech-recognition
    MptForCausalLM,text-generation
    MusicgenForConditionalGeneration,text-to-audio
    NystromformerModel,feature-extraction
    OPTModel,feature-extraction
    Olmo2ForCausalLM,text-generation
    OlmoForCausalLM,text-generation
    OwlViTModel,feature-extraction
    Owlv2Model,feature-extraction
    PatchTSMixerForPrediction,no-pipeline-tag
    PatchTSTForPrediction,no-pipeline-tag
    PegasusModel,feature-extraction
    Phi3ForCausalLM,text-generation
    PhiForCausalLM,text-generation
    PhiMoEForCausalLM,text-generation
    Pix2StructForConditionalGeneration,image-to-text
    PLBartForConditionalGeneration,text2text-generation
    PoolFormerModel,image-feature-extraction
    PvtForImageClassification,image-classification
    Qwen2ForCausalLM,text-generation
    Qwen2_5_VLForConditionalGeneration,image-text-to-text
    Qwen3MoeForCausalLM,text-generation
    RTDetrForObjectDetection,object-detection
    RegNetModel,image-feature-extraction
    RemBertModel,feature-extraction
    ResNetForImageClassification,image-classification
    RoFormerModel,feature-extraction
    RobertaForMaskedLM,sentence-similarity
    RobertaModel,feature-extraction
    RtDetrV2ForObjectDetection,object-detection
    SEWDModel,feature-extraction
    SEWModel,feature-extraction
    SamModel,mask-generation
    SegformerModel,image-feature-extraction
    SiglipModel,zero-shot-image-classification
    SiglipVisionModel,image-feature-extraction
    Speech2TextModel,feature-extraction
    SpeechT5ForTextToSpeech,text-to-audio
    SplinterModel,feature-extraction
    SqueezeBertModel,feature-extraction
    Swin2SRModel,image-feature-extraction
    SwinModel,image-feature-extraction
    Swinv2Model,image-feature-extraction
    T5ForConditionalGeneration,text2text-generation
    T5GemmaForConditionalGeneration,text2text-generation
    TableTransformerModel,image-feature-extraction
    TableTransformerForObjectDetection,object-detection
    UNet2DConditionModel,text-to-image
    UniSpeechForSequenceClassification,audio-classification
    ViTForImageClassification,image-classification
    ViTMAEModel,image-feature-extraction
    ViTMSNForImageClassification,image-classification
    VisionEncoderDecoderModel,document-question-answering
    VitPoseForPoseEstimation,keypoint-detection
    VitsModel,text-to-audio
    Wav2Vec2ConformerForCTC,automatic-speech-recognition
    Wav2Vec2Model,feature-extraction
    WhisperForConditionalGeneration,automatic-speech-recognition
    XLMModel,feature-extraction
    XLMRobertaForCausalLM,text-generation
    XLMRobertaForMaskedLM,fill-mask
    XLMRobertaModel,sentence-similarity
    Wav2Vec2ForCTC,automatic-speech-recognition
    YolosForObjectDetection,object-detection
    YolosModel,image-feature-extraction
    Alibaba-NLP/gte-large-en-v1.5,sentence-similarity
    emilyalsentzer/Bio_ClinicalBERT,fill-mask
    nvidia/Cosmos-Predict2-2B-Video2World//transformer,image-to-video""")

__data_tasks__ = [
    "audio-classification",
    "automatic-speech-recognition",
    "document-question-answering",
    "feature-extraction",
    "fill-mask",
    "image-classification",
    "image-feature-extraction",
    "image-segmentation",
    "image-text-to-text",
    "image-to-text",
    "keypoint-detection",
    "mask-generation",
    "no-pipeline-tag",
    "object-detection",
    "reinforcement-learning",
    "sentence-similarity",
    "summarization",
    "text-classification",
    "text-generation",
    "text-to-image",
    "text-to-audio",
    "text2text-generation",
    "zero-shot-image-classification",
]

__models_testing__ = """
hf-internal-testing/tiny-random-BeitForImageClassification
hf-internal-testing/tiny-random-convnext
fxmarty/tiny-random-GemmaForCausalLM
hf-internal-testing/tiny-random-GPTNeoXForCausalLM
hf-internal-testing/tiny-random-GraniteForCausalLM
hf-internal-testing/tiny-random-HieraForImageClassification
fxmarty/tiny-llama-fast-tokenizer
sshleifer/tiny-marian-en-de
hf-internal-testing/tiny-random-MaskFormerForInstanceSegmentation
echarlaix/tiny-random-mistral
hf-internal-testing/tiny-random-mobilevit
hf-internal-testing/tiny-random-MoonshineForConditionalGeneration
hf-internal-testing/tiny-random-OlmoForCausalLM
hf-internal-testing/tiny-random-Olmo2ForCausalLM
echarlaix/tiny-random-PhiForCausalLM
Xenova/tiny-random-Phi3ForCausalLM
fxmarty/pix2struct-tiny-random
fxmarty/tiny-dummy-qwen2
hf-internal-testing/tiny-random-ViTMSNForImageClassification
hf-internal-testing/tiny-random-YolosModel
hf-internal-testing/tiny-xlm-roberta
HuggingFaceM4/tiny-random-idefics
"""



[docs]
@functools.cache
def load_models_testing() -> List[str]:
    """Returns model ids for testing."""
    return [_.strip() for _ in __models_testing__.split("\n") if _.strip()]




[docs]
@functools.cache
def load_architecture_task() -> Dict[str, str]:
    """
    Returns a dictionary mapping architectures to tasks.

    import pprint
    from onnx_diagnostic.torch_models.hghub.hub_data import load_architecture_task
    pprint.pprint(load_architecture_task())
    """
    import pandas

    df = pandas.read_csv(io.StringIO(__data_arch__))
    return dict(zip(list(df["architecture"]), list(df["task"])))