llmfit 0.1.2

Right-size LLM models to your system hardware. Interactive TUI and CLI to match models against available RAM, CPU, and GPU.
{"version":3,"term":{"cols":136,"rows":36,"type":"xterm-256color","version":"VTE(8004)","theme":{"fg":"#17a88b","bg":"#080d14","palette":"#1e2229:#ed1515:#44853a:#f67400:#1d99f3:#9b59b6:#1abc9c:#fcfcfc:#7f8c8d:#c0392b:#55a649:#fdbc4b:#3daee9:#8e44ad:#16a085:#ffffff"}},"timestamp":1771175323,"command":"./target/release/llmfit","env":{"SHELL":"/usr/bin/zsh"}}
[0.004, "o", "\u001b[?1049h\u001b[?1000h\u001b[?1002h\u001b[?1003h\u001b[?1015h\u001b[?1006h"]
[0.133, "o", "\u001b[1;1H\u001b[38;5;8;49m┌\u001b[1m\u001b[38;5;2;49m llmfit \u001b[22m\u001b[38;5;8;49m──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐\u001b[2;1H│ CPU: \u001b[38;5;15;49mIntel(R) Core(TM) Ultra 7 165H (22 cores)\u001b[38;5;8;49m  │  RAM: \u001b[38;5;6;49m20.5 GB avail / 30.8 GB total\u001b[38;5;8;49m  │  \u001b[38;5;3;49mGPU: 8.0 GB VRAM\u001b[2;136H\u001b[38;5;8;49m│\u001b[3;1H└──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘\u001b[4;1H┌ Search ────────────────────────────────────────────────────────┐┌ Providers ─────────────────────────────────────┐┌ Fit [f] ─────────┐\u001b[5;1H│Press / to search...\u001b[5;66H││\u001b[38;5;2;49m[1:Alibaba]\u001b[5;80H[2:BAAI]\u001b[5;89H[3:BigCode]\u001b[5;101H[4:Cohere]\u001b[5;112H[5:C\u001b[38;5;8;49m││\u001b[38;5;15;49mAll\u001b[5;136H\u001b[38;5;8;49m│\u001b[6;1H└────────────────────────────────────────────────────────────────┘└────────────────────────────────────────────────┘└──────────────────┘\u001b[7;1H┌\u001b[38;5;15;49m Models (33/33) \u001b[38;5;8;49m──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────↑\u001b[8;1H│\u001b[8;4H\u001b[1m\u001b[38;5;6;49m  \u001b[8;7HModel                      \u001b[8;35HProvider    \u001b[8;48HParams  \u001b[8;57HVRAM     \u001b[8;67HRAM      \u001b[8;77HMode   \u001b[8;85HMem % \u001b[8;92HCtx  \u001b[8;98HFit       \u001b[8;109HUse Case                   \u001b[22m\u001b[38;5;8;49m█\u001b[9;1H│\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mnomic-ai/nomic-embed-text-v\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mNomic       \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m137M    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m0.5 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m6%    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m8k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mText embeddings for RAG    \u001b[22m\u001b[38;5;8;49m█\u001b[10;1H│\u001b[10;4H\u001b[38;5;2;49m● \u001b[10;7H\u001b[38;5;15;49mBAAI/bge-large-en-v1.5     \u001b[10;35H\u001b[38;5;8;49mBAAI        \u001b[10;48H\u001b[38;5;15;49m335M    \u001b[10;57H0.5 GB   \u001b[10;67H1.0 GB   \u001b[10;77H\u001b[38;5;2;49mGPU    \u001b[10;85H6%    \u001b[10;92H\u001b[38;5;8;49m0k   \u001b[10;98H\u001b[38;5;2;49mPerfect   \u001b[10;109H\u001b[38;5;8;49mText embeddings for RAG    █\u001b[11;1H│\u001b[11;4H\u001b[38;5;2;49m● \u001b[11;7H\u001b[38;5;15;49mTinyLlama/TinyLlama-1.1B-Ch\u001b[11;35H\u001b[38;5;8;49mCommunity   \u001b[11;48H\u001b[38;5;15;49m1.1B    \u001b[11;57H0.6 GB   \u001b[11;67H1.0 GB   \u001b[11;77H\u001b[38;5;2;49mGPU    \u001b[11;85H8%    \u001b[11;92H\u001b[38;5;8;49m2k   \u001b[11;98H\u001b[38;5;2;49mPerfect   \u001b[11;109H\u001b[38;5;8;49mInstruction following, chat█\u001b[12;1H│\u001b[12;4H\u001b[38;5;2;49m● \u001b[12;7H\u001b[38;5;15;49mmeta-llama/Llama-3.2-1B    \u001b[12;35H\u001b[38;5;8;49mMeta        \u001b[12;48H\u001b[38;5;15;49m1.2B    \u001b[12;57H0.6 GB   \u001b[12;67H1.0 GB   \u001b[12;77H\u001b[38;5;2;49mGPU    \u001b[12;85H8%    \u001b[12;92H\u001b[38;5;8;49m4k   \u001b[12;98H\u001b[38;5;2;49mPerfect   \u001b[12;109H\u001b[38;5;8;49mGeneral "]
[0.000, "o", "purpose text genera█\u001b[13;1H│\u001b[13;4H\u001b[38;5;2;49m● \u001b[13;7H\u001b[38;5;15;49mstabilityai/stablelm-2-1_6b\u001b[13;35H\u001b[38;5;8;49mStability AI\u001b[13;48H\u001b[38;5;15;49m1.6B    \u001b[13;57H0.8 GB   \u001b[13;67H1.0 GB   \u001b[13;77H\u001b[38;5;2;49mGPU    \u001b[13;85H10%   \u001b[13;92H\u001b[38;5;8;49m4k   \u001b[13;98H\u001b[38;5;2;49mPerfect   \u001b[13;109H\u001b[38;5;8;49mInstruction following, chat█\u001b[14;1H│\u001b[14;4H\u001b[38;5;2;49m● \u001b[14;7H\u001b[38;5;15;49mmeta-llama/Llama-3.2-3B    \u001b[14;35H\u001b[38;5;8;49mMeta        \u001b[14;48H\u001b[38;5;15;49m3.2B    \u001b[14;57H1.6 GB   \u001b[14;67H1.8 GB   \u001b[14;77H\u001b[38;5;2;49mGPU    \u001b[14;85H20%   \u001b[14;92H\u001b[38;5;8;49m4k   \u001b[14;98H\u001b[38;5;2;49mPerfect   \u001b[14;109H\u001b[38;5;8;49mGeneral purpose text genera█\u001b[15;1H│\u001b[15;4H\u001b[38;5;2;49m● \u001b[15;7H\u001b[38;5;15;49mmicrosoft/phi-3-mini-4k-ins\u001b[15;35H\u001b[38;5;8;49mMicrosoft   \u001b[15;48H\u001b[38;5;15;49m3.8B    \u001b[15;57H2.0 GB   \u001b[15;67H2.1 GB   \u001b[15;77H\u001b[38;5;2;49mGPU    \u001b[15;85H25%   \u001b[15;92H\u001b[38;5;8;49m4k   \u001b[15;98H\u001b[38;5;2;49mPerfect   \u001b[15;109H\u001b[38;5;8;49mLightweight, edge deploymen█\u001b[16;1H│\u001b[16;4H\u001b[38;5;2;49m● \u001b[16;7H\u001b[38;5;15;49mbigcode/starcoder2-7b      \u001b[16;35H\u001b[38;5;8;49mBigCode     \u001b[16;48H\u001b[38;5;15;49m7.2B    \u001b[16;57H3.7 GB   \u001b[16;67H4.0 GB   \u001b[16;77H\u001b[38;5;2;49mGPU    \u001b[16;85H46%   \u001b[16;92H\u001b[38;5;8;49m16k  \u001b[16;98H\u001b[38;5;2;49mPerfect   \u001b[16;109H\u001b[38;5;8;49mCode generation and complet█\u001b[17;1H│\u001b[17;4H\u001b[38;5;2;49m● \u001b[17;7H\u001b[38;5;15;49mmistralai/Mistral-7B-Instru\u001b[17;35H\u001b[38;5;8;49mMistral AI  \u001b[17;48H\u001b[38;5;15;49m7.2B    \u001b[17;57H3.7 GB   \u001b[17;67H4.1 GB   \u001b[17;77H\u001b[38;5;2;49mGPU    \u001b[17;85H46%   \u001b[17;92H\u001b[38;5;8;49m32k  \u001b[17;98H\u001b[38;5;2;49mPerfect   \u001b[17;109H\u001b[38;5;8;49mInstruction following, chat█\u001b[18;1H│\u001b[18;4H\u001b[38;5;2;49m● \u001b[18;7H\u001b[38;5;15;49mQwen/Qwen2.5-7B-Instruct   \u001b[18;35H\u001b[38;5;8;49mAlibaba     \u001b[18;48H\u001b[38;5;15;49m7.6B    \u001b[18;57H3.9 GB   \u001b[18;67H4.3 GB   \u001b[18;77H\u001b[38;5;2;49mGPU    \u001b[18;85H49%   \u001b[18;92H\u001b[38;5;8;49m32k  \u001b[18;98H\u001b[38;5;2;49mPerfect   \u001b[18;109H\u001b[38;5;8;49mInstruction following, chat█\u001b[19;1H│\u001b[19;4H\u001b[38;5;2;49m● \u001b[19;7H\u001b[38;5;15;49mdeepseek-ai/DeepSeek-R1-Dis\u001b[19;35H\u001b[38;5;8;49mDeepSeek    \u001b[19;48H\u001b[38;5;15;49m7.6B    \u001b[19;57H3.9 GB   \u001b[19;67H4.3 GB   \u001b[19;77H\u001b[38;5;2;49mGPU    \u001b[19;85H49%   \u001b[19;92H\u001b[38;5;8;49m131k \u001b[19;98H\u001b[38;5;2;49mPerfect   \u001b[19;109H\u001b[38;5;8;49mAdvanced reasoning, chain-o█\u001b[20;1H│\u001b[20;4H\u001b[38;5;2;49m● \u001b[20;7H\u001b[38;5;15;49mmeta-llama/Llama-3.1-8B    \u001b[20;35H\u001b[38;5;8;49mMeta        \u001b[20;48H\u001b[38;5;15;49m8.0B    \u001b[20;57H4.1 GB   \u001b[20;67H4.5 GB   \u001b[20;77H\u001b[38;5;2;49mGPU    \u001b[20;85H51%   \u001b[20;92H\u001b[38;5;8;49m4k   \u001b[20;98H\u001b[38;5;2;49mPerfect   \u001b[20;109H\u001b[38;5;8;49mGeneral purpose text genera█\u001b[21;1H│\u001b[21;4H\u001b[38;5;2;49m● \u001b[21;7H\u001b[38;5;15;49mmeta-llama/Llama-3.1-8B-Ins\u001b[21;35H\u001b[38;5;8;49mMeta        \u001b[21;48H\u001b[38;5;15;49m8.0B    \u001b[21;57H4.1 GB   \u001b[21;67H4.5 GB   \u001b[21;77H\u001b[38;5;2;49mGPU    \u001b[21;85H51%   \u001b[21;92H\u001b[38;5;8;49m4k   \u001b[21;98H\u001b[38;5;2;49mPerfect   \u001b[21;109H\u001b[38;5;8;49mInstruction following, chat║\u001b[22;1H│\u001b[22;4H\u001b[38;5;2;49m● \u001b[22;7H\u001b[38;5;15;49mQwen/Qwen3-8B              \u001b[22;35H\u001b[38;5;8;49mAlibaba     \u001b[22;48H\u001b[38;5;15;49m8.2B    \u001b[22;57H4.2 GB   \u001b[22;67H4.6 GB   \u001b[22;77H\u001b[38;5;2;49mGPU    \u001b[22;85H53%   \u001b[22;92H\u001b[38;5;8;49m40k  \u001b[22;98H\u001b[38;5;2;49mPerfect   \u001b[22;109H\u001b[38;5;8;49mGeneral purpose text genera║\u001b[23;1H│\u001b[23;4H\u001b[38;5;3;49m● \u001b[23;7H\u001b[38;5;15;49mgoogle/gemma-2-9b-it       \u001b[23;35H\u001b[38;5;8;49mGoogle      \u001b[23;48H\u001b[38;5;15;49m9.2B    \u001b[23;57H4.7 GB   \u001b[23;67H5.2 GB   \u001b[23;77H\u001b[38;5;2;49mGPU    \u001b[23;85H\u001b[38;5;3;49m59%   \u001b[23;92H\u001b[38;5;8;49m4k   \u001b[23;98H\u001b[38;5;3;49mGood      \u001b[23;109H\u001b[38;5;8;49mGeneral purpose text genera║\u001b[24;1H│\u001b[24;4H\u001b[38;5;3;49m● \u001b[24;7H\u001b[38;5;15;49mgoogle/gemma-3-12b-it      \u001b[24;35H\u001b[38;5;8;49mGoogle      \u001b[24;48H\u001b[38;5;15;49m12B     \u001b[24;57H6.1 GB   \u001b[24;67H6.7 GB   \u001b[24;77H\u001b[38;5;2;49mGPU    \u001b[24;85H\u001b[38;5;3;49m76%   \u001b[24;92H\u001b[38;5;8;49m131k \u001b[24;98H\u001b[38;5;3;49mGood      \u001b[24;109H\u001b[38;5;8;49mMultimodal, vision and text║\u001b[25;1H│\u001b[25;4H\u001b[38;5;3;49m● \u001b[25;7H\u001b[38;5;15;49mbigcode/starcoder2-15b     \u001b[25;35H\u001b[38;5;8;49mBigCode     \u001b[25;48H\u001b[38;5;15;49m15.7B   \u001b[25;57H8.0 GB   \u001b[25;67H8.8 GB   \u001b[25;77H\u001b["]
[0.000, "o", "38;5;3;49mCPU+GPU\u001b[25;85H43%   \u001b[25;92H\u001b[38;5;8;49m16k  \u001b[25;98H\u001b[38;5;3;49mGood      \u001b[25;109H\u001b[38;5;8;49mCode generation and complet║\u001b[26;1H│\u001b[26;4H\u001b[38;5;3;49m● \u001b[26;7H\u001b[38;5;15;49mdeepseek-ai/DeepSeek-Coder-\u001b[26;35H\u001b[38;5;8;49mDeepSeek    \u001b[26;48H\u001b[38;5;15;49m16B     \u001b[26;57H8.0 GB   \u001b[26;67H8.8 GB   \u001b[26;77H\u001b[38;5;3;49mCPU+GPU\u001b[26;85H43%   \u001b[26;92H\u001b[38;5;8;49m131k \u001b[26;98H\u001b[38;5;3;49mGood      \u001b[26;109H\u001b[38;5;8;49mCode generation and complet║\u001b[27;1H│\u001b[27;4H\u001b[38;5;3;49m● \u001b[27;7H\u001b[38;5;15;49mmistralai/Mistral-Small-24B\u001b[27;35H\u001b[38;5;8;49mMistral AI  \u001b[27;48H\u001b[38;5;15;49m24B     \u001b[27;57H12.3 GB  \u001b[27;67H13.4 GB  \u001b[27;77H\u001b[38;5;3;49mCPU+GPU\u001b[27;85H65%   \u001b[27;92H\u001b[38;5;8;49m32k  \u001b[27;98H\u001b[38;5;3;49mGood      \u001b[27;109H\u001b[38;5;8;49mInstruction following, chat║\u001b[28;1H│\u001b[28;4H\u001b[38;5;3;49m● \u001b[28;7H\u001b[38;5;15;49mgoogle/gemma-2-27b-it      \u001b[28;35H\u001b[38;5;8;49mGoogle      \u001b[28;48H\u001b[38;5;15;49m27.2B   \u001b[28;57H13.9 GB  \u001b[28;67H15.2 GB  \u001b[28;77H\u001b[38;5;3;49mCPU+GPU\u001b[28;85H74%   \u001b[28;92H\u001b[38;5;8;49m4k   \u001b[28;98H\u001b[38;5;3;49mGood      \u001b[28;109H\u001b[38;5;8;49mGeneral purpose text genera║\u001b[29;1H│\u001b[29;4H\u001b[38;5;5;49m● \u001b[29;7H\u001b[38;5;15;49mmicrosoft/phi-4            \u001b[29;35H\u001b[38;5;8;49mMicrosoft   \u001b[29;48H\u001b[38;5;15;49m14B     \u001b[29;57H7.2 GB   \u001b[29;67H7.8 GB   \u001b[29;77H\u001b[38;5;2;49mGPU    \u001b[29;85H\u001b[38;5;5;49m90%   \u001b[29;92H\u001b[38;5;8;49m16k  \u001b[29;98H\u001b[38;5;5;49mMarginal  \u001b[29;109H\u001b[38;5;8;49mReasoning, STEM, code gener║\u001b[30;1H│\u001b[30;4H\u001b[38;5;5;49m● \u001b[30;7H\u001b[38;5;15;49mmicrosoft/Phi-3-medium-14b-\u001b[30;35H\u001b[38;5;8;49mMicrosoft   \u001b[30;48H\u001b[38;5;15;49m14B     \u001b[30;57H7.2 GB   \u001b[30;67H7.8 GB   \u001b[30;77H\u001b[38;5;2;49mGPU    \u001b[30;85H\u001b[38;5;5;49m90%   \u001b[30;92H\u001b[38;5;8;49m4k   \u001b[30;98H\u001b[38;5;5;49mMarginal  \u001b[30;109H\u001b[38;5;8;49mBalanced performance and si║\u001b[31;1H│\u001b[31;4H\u001b[38;5;5;49m● \u001b[31;7H\u001b[38;5;15;49mQwen/Qwen2.5-14B-Instruct  \u001b[31;35H\u001b[38;5;8;49mAlibaba     \u001b[31;48H\u001b[38;5;15;49m14.8B   \u001b[31;57H7.6 GB   \u001b[31;67H8.2 GB   \u001b[31;77H\u001b[38;5;2;49mGPU    \u001b[31;85H\u001b[38;5;5;49m95%   \u001b[31;92H\u001b[38;5;8;49m131k \u001b[31;98H\u001b[38;5;5;49mMarginal  \u001b[31;109H\u001b[38;5;8;49mInstruction following, chat║\u001b[32;1H│\u001b[32;4H\u001b[38;5;5;49m● \u001b[32;7H\u001b[38;5;15;49mQwen/Qwen2.5-32B-Instruct  \u001b[32;35H\u001b[38;5;8;49mAlibaba     \u001b[32;48H\u001b[38;5;15;49m32.5B   \u001b[32;57H16.7 GB  \u001b[32;67H18.2 GB  \u001b[32;77H\u001b[38;5;3;49mCPU+GPU\u001b[32;85H\u001b[38;5;5;49m89%   \u001b[32;92H\u001b[38;5;8;49m131k \u001b[32;98H\u001b[38;5;5;49mMarginal  \u001b[32;109H\u001b[38;5;8;49mInstruction following, chat║\u001b[33;1H│\u001b[33;4H\u001b[38;5;5;49m● \u001b[33;7H\u001b[38;5;15;49mQwen/Qwen3-32B             \u001b[33;35H\u001b[38;5;8;49mAlibaba     \u001b[33;48H\u001b[38;5;15;49m32.8B   \u001b[33;57H16.8 GB  \u001b[33;67H18.3 GB  \u001b[33;77H\u001b[38;5;3;49mCPU+GPU\u001b[33;85H\u001b[38;5;5;49m89%   \u001b[33;92H\u001b[38;5;8;49m40k  \u001b[33;98H\u001b[38;5;5;49mMarginal  \u001b[33;109H\u001b[38;5;8;49mGeneral purpose text genera║\u001b[34;1H│\u001b[34;4H\u001b[38;5;5;49m● \u001b[34;7H\u001b[38;5;15;49mdeepseek-ai/DeepSeek-R1-Dis\u001b[34;35H\u001b[38;5;8;49mDeepSeek    \u001b[34;48H\u001b[38;5;15;49m32.8B   \u001b[34;57H16.8 GB  \u001b[34;67H18.3 GB  \u001b[34;77H\u001b[38;5;3;49mCPU+GPU\u001b[34;85H\u001b[38;5;5;49m89%   \u001b[34;92H\u001b[38;5;8;49m131k \u001b[34;98H\u001b[38;5;5;49mMarginal  \u001b[34;109H\u001b[38;5;8;49mAdvanced reasoning, chain-o║\u001b[35;1H└──────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────↓\u001b[36;1H\u001b[1m\u001b[38;5;0;48;5;2m NORMAL \u001b[22m\u001b[38;5;8;49m ↑↓/jk:navigate  Enter:detail  /:search  f:fit filter  1-12:providers  q:quit\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.000, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.048, "o", "\u001b[9;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mnomic-ai/nomic-embed-text-v\u001b[39;49m \u001b[38;5;8;49mNomic       \u001b[39;49m \u001b[38;5;15;49m137M    \u001b[39;49m \u001b[38;5;15;49m0.5 GB   \u001b[39;49m \u001b[38;5;15;49m1.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m6%    \u001b[39;49m \u001b[38;5;8;49m8k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mText embeddings for RAG    \u001b[10;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mBAAI/bge-large-en-v1.5     \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mBAAI        \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m335M    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m0.5 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m6%    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m0k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mText embeddings for RAG    \u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.048, "o", "\u001b[8;136H\u001b[38;5;8;49m║\u001b[10;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mBAAI/bge-large-en-v1.5     \u001b[39;49m \u001b[38;5;8;49mBAAI        \u001b[39;49m \u001b[38;5;15;49m335M    \u001b[39;49m \u001b[38;5;15;49m0.5 GB   \u001b[39;49m \u001b[38;5;15;49m1.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m6%    \u001b[39;49m \u001b[38;5;8;49m0k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mText embeddings for RAG    \u001b[11;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mTinyLlama/TinyLlama-1.1B-Ch\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mCommunity   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.1B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m0.6 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m8%    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m2k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[21;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.048, "o", "\u001b[11;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mTinyLlama/TinyLlama-1.1B-Ch\u001b[39;49m \u001b[38;5;8;49mCommunity   \u001b[39;49m \u001b[38;5;15;49m1.1B    \u001b[39;49m \u001b[38;5;15;49m0.6 GB   \u001b[39;49m \u001b[38;5;15;49m1.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m8%    \u001b[39;49m \u001b[38;5;8;49m2k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[12;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmeta-llama/Llama-3.2-1B    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMeta        \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m0.6 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m8%    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.038, "o", "\u001b[9;136H\u001b[38;5;8;49m║\u001b[12;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmeta-llama/Llama-3.2-1B    \u001b[39;49m \u001b[38;5;8;49mMeta        \u001b[39;49m \u001b[38;5;15;49m1.2B    \u001b[39;49m \u001b[38;5;15;49m0.6 GB   \u001b[39;49m \u001b[38;5;15;49m1.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m8%    \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[13;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mstabilityai/stablelm-2-1_6b\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mStability AI\u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.6B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m0.8 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m10%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[22;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.003, "o", "\u001b[13;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mstabilityai/stablelm-2-1_6b\u001b[39;49m \u001b[38;5;8;49mStability AI\u001b[39;49m \u001b[38;5;15;49m1.6B    \u001b[39;49m \u001b[38;5;15;49m0.8 GB   \u001b[39;49m \u001b[38;5;15;49m1.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m10%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[14;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmeta-llama/Llama-3.2-3B    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMeta        \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.6 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m1.8 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m20%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.022, "o", "\u001b[10;136H\u001b[38;5;8;49m║\u001b[14;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmeta-llama/Llama-3.2-3B    \u001b[39;49m \u001b[38;5;8;49mMeta        \u001b[39;49m \u001b[38;5;15;49m3.2B    \u001b[39;49m \u001b[38;5;15;49m1.6 GB   \u001b[39;49m \u001b[38;5;15;49m1.8 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m20%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[15;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmicrosoft/phi-3-mini-4k-ins\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMicrosoft   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.8B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m2.0 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m2.1 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m25%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mLightweight, edge deploymen\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.040, "o", "\u001b[15;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmicrosoft/phi-3-mini-4k-ins\u001b[39;49m \u001b[38;5;8;49mMicrosoft   \u001b[39;49m \u001b[38;5;15;49m3.8B    \u001b[39;49m \u001b[38;5;15;49m2.0 GB   \u001b[39;49m \u001b[38;5;15;49m2.1 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m25%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mLightweight, edge deploymen\u001b[16;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mbigcode/starcoder2-7b      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mBigCode     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m7.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.7 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.0 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m46%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m16k  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mCode generation and complet\u001b[23;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[11;136H\u001b[38;5;8;49m║\u001b[16;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mbigcode/starcoder2-7b      \u001b[39;49m \u001b[38;5;8;49mBigCode     \u001b[39;49m \u001b[38;5;15;49m7.2B    \u001b[39;49m \u001b[38;5;15;49m3.7 GB   \u001b[39;49m \u001b[38;5;15;49m4.0 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m46%   \u001b[39;49m \u001b[38;5;8;49m16k  \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mCode generation and complet\u001b[17;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmistralai/Mistral-7B-Instru\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMistral AI  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m7.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.7 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.1 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m46%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m32k  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[17;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmistralai/Mistral-7B-Instru\u001b[39;49m \u001b[38;5;8;49mMistral AI  \u001b[39;49m \u001b[38;5;15;49m7.2B    \u001b[39;49m \u001b[38;5;15;49m3.7 GB   \u001b[39;49m \u001b[38;5;15;49m4.1 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m46%   \u001b[39;49m \u001b[38;5;8;49m32k  \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[18;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen2.5-7B-Instruct   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m7.6B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.9 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.3 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m49%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m32k  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[24;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[18;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen2.5-7B-Instruct   \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m7.6B    \u001b[39;49m \u001b[38;5;15;49m3.9 GB   \u001b[39;49m \u001b[38;5;15;49m4.3 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m49%   \u001b[39;49m \u001b[38;5;8;49m32k  \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[19;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mdeepseek-ai/DeepSeek-R1-Dis\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mDeepSeek    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m7.6B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m3.9 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.3 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m49%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAdvanced reasoning, chain-o\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[12;136H\u001b[38;5;8;49m║\u001b[19;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mdeepseek-ai/DeepSeek-R1-Dis\u001b[39;49m \u001b[38;5;8;49mDeepSeek    \u001b[39;49m \u001b[38;5;15;49m7.6B    \u001b[39;49m \u001b[38;5;15;49m3.9 GB   \u001b[39;49m \u001b[38;5;15;49m4.3 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m49%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mAdvanced reasoning, chain-o\u001b[20;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmeta-llama/Llama-3.1-8B    \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMeta        \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.0B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.1 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.5 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m51%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[25;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[20;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmeta-llama/Llama-3.1-8B    \u001b[39;49m \u001b[38;5;8;49mMeta        \u001b[39;49m \u001b[38;5;15;49m8.0B    \u001b[39;49m \u001b[38;5;15;49m4.1 GB   \u001b[39;49m \u001b[38;5;15;49m4.5 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m51%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[21;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmeta-llama/Llama-3.1-8B-Ins\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMeta        \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.0B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.1 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.5 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m51%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[13;136H\u001b[38;5;8;49m║\u001b[21;2H\u001b[39;49m  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mmeta-llama/Llama-3.1-8B-Ins\u001b[39;49m \u001b[38;5;8;49mMeta        \u001b[39;49m \u001b[38;5;15;49m8.0B    \u001b[39;49m \u001b[38;5;15;49m4.1 GB   \u001b[39;49m \u001b[38;5;15;49m4.5 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m51%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[22;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen3-8B              \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.2 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.6 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m53%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m40k  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[26;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[22;2H  \u001b[38;5;2;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen3-8B              \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m8.2B    \u001b[39;49m \u001b[38;5;15;49m4.2 GB   \u001b[39;49m \u001b[38;5;15;49m4.6 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;2;49m53%   \u001b[39;49m \u001b[38;5;8;49m40k  \u001b[39;49m \u001b[38;5;2;49mPerfect   \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[23;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mgoogle/gemma-2-9b-it       \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGoogle      \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m9.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.7 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m5.2 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;3;48;5;8m59%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[14;136H\u001b[38;5;8;49m║\u001b[23;2H\u001b[39;49m  \u001b[38;5;3;49m● \u001b[39;49m \u001b[38;5;15;49mgoogle/gemma-2-9b-it       \u001b[39;49m \u001b[38;5;8;49mGoogle      \u001b[39;49m \u001b[38;5;15;49m9.2B    \u001b[39;49m \u001b[38;5;15;49m4.7 GB   \u001b[39;49m \u001b[38;5;15;49m5.2 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;3;49m59%   \u001b[39;49m \u001b[38;5;8;49m4k   \u001b[39;49m \u001b[38;5;3;49mGood      \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[24;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mgoogle/gemma-3-12b-it      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGoogle      \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m12B     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m6.1 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m6.7 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;3;48;5;8m76%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMultimodal, vision and text\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.031, "o", "\u001b[24;2H  \u001b[38;5;3;49m● \u001b[39;49m \u001b[38;5;15;49mgoogle/gemma-3-12b-it      \u001b[39;49m \u001b[38;5;8;49mGoogle      \u001b[39;49m \u001b[38;5;15;49m12B     \u001b[39;49m \u001b[38;5;15;49m6.1 GB   \u001b[39;49m \u001b[38;5;15;49m6.7 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;3;49m76%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;3;49mGood      \u001b[39;49m \u001b[38;5;8;49mMultimodal, vision and text\u001b[25;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mbigcode/starcoder2-15b     \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mBigCode     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m15.7B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.0 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.8 GB   \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;3;48;5;8m43%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m16k  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mCode generation and complet\u001b[27;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[15;136H\u001b[38;5;8;49m║\u001b[25;2H\u001b[39;49m  \u001b[38;5;3;49m● \u001b[39;49m \u001b[38;5;15;49mbigcode/starcoder2-15b     \u001b[39;49m \u001b[38;5;8;49mBigCode     \u001b[39;49m \u001b[38;5;15;49m15.7B   \u001b[39;49m \u001b[38;5;15;49m8.0 GB   \u001b[39;49m \u001b[38;5;15;49m8.8 GB   \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;3;49m43%   \u001b[39;49m \u001b[38;5;8;49m16k  \u001b[39;49m \u001b[38;5;3;49mGood      \u001b[39;49m \u001b[38;5;8;49mCode generation and complet\u001b[26;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mdeepseek-ai/DeepSeek-Coder-\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mDeepSeek    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m16B     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.0 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.8 GB   \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;3;48;5;8m43%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mCode generation and complet\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.030, "o", "\u001b[26;2H  \u001b[38;5;3;49m● \u001b[39;49m \u001b[38;5;15;49mdeepseek-ai/DeepSeek-Coder-\u001b[39;49m \u001b[38;5;8;49mDeepSeek    \u001b[39;49m \u001b[38;5;15;49m16B     \u001b[39;49m \u001b[38;5;15;49m8.0 GB   \u001b[39;49m \u001b[38;5;15;49m8.8 GB   \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;3;49m43%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;3;49mGood      \u001b[39;49m \u001b[38;5;8;49mCode generation and complet\u001b[27;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mmistralai/Mistral-Small-24B\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mMistral AI  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m24B     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m12.3 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m13.4 GB  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;3;48;5;8m65%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m32k  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[28;136H\u001b[22m\u001b[38;5;8;49m█\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.029, "o", "\u001b[27;2H  \u001b[38;5;3;49m● \u001b[39;49m \u001b[38;5;15;49mmistralai/Mistral-Small-24B\u001b[39;49m \u001b[38;5;8;49mMistral AI  \u001b[39;49m \u001b[38;5;15;49m24B     \u001b[39;49m \u001b[38;5;15;49m12.3 GB  \u001b[39;49m \u001b[38;5;15;49m13.4 GB  \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;3;49m65%   \u001b[39;49m \u001b[38;5;8;49m32k  \u001b[39;49m \u001b[38;5;3;49mGood      \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[28;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;3;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mgoogle/gemma-2-27b-it      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGoogle      \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m27.2B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m13.9 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m15.2 GB  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;3;48;5;8m74%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m4k   \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mGood      \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.029, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.018, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.044, "o", "\u001b[4;1H\u001b[38;5;3;49m┌ Search ────────────────────────────────────────────────────────┐\u001b[5;1H│\u001b[39;49m                    \u001b[5;66H\u001b[38;5;3;49m│\u001b[6;1H└────────────────────────────────────────────────────────────────┘\u001b[36;2H\u001b[1m\u001b[38;5;0;48;5;2mSEARCH\u001b[36;10H\u001b[22m\u001b[38;5;8;49m Type to se\u001b[36;22Hrch\u001b[36;26H Esc:done  Ctrl-U:clear\u001b[39;49m                                     \u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.036, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.001, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.035, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.019, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.002, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.018, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.009, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.052, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;2H"]
[0.023, "o", "\u001b[5;2H\u001b[38;5;15;49mq\u001b[7;11H8/3\u001b[7;15H) \u001b[38;5;8;49m─\u001b[7;136H┐\u001b[8;136H│\u001b[9;7H\u001b[38;5;15;49mQwen/Qwen2.5-7B-Instruct   \u001b[9;35H\u001b[38;5;8;49mAlibaba\u001b[9;48H\u001b[38;5;15;49m7.6B\u001b[9;57H3\u001b[9;59H9\u001b[9;67H4\u001b[9;69H3\u001b[9;85H\u001b[38;5;2;49m49%\u001b[9;92H\u001b[38;5;8;49m32k\u001b[9;109HIns\u001b[9;113Hruction following, chat│\u001b[10;7H\u001b[38;5;15;49mdeepseek\u001b[10;16Hai/D\u001b[10;21HepSeek-R1-Dis\u001b[10;35H\u001b[38;5;8;49mDeepSeek\u001b[10;48H\u001b[38;5;15;49m7.6B\u001b[10;57H3\u001b[10;59H9\u001b[10;67H4\u001b[10;69H3\u001b[10;85H\u001b[38;5;2;49m49%\u001b[10;92H\u001b[38;5;8;49m131k\u001b[10;109HAdvanced reasoning,\u001b[10;129Hchain-o│\u001b[11;7H\u001b[38;5;15;49mQwen/Qwen3-8B              \u001b[11;35H\u001b[38;5;8;49mAlibaba  \u001b[11;48H\u001b[38;5;15;49m8\u001b[11;50H2\u001b[11;57H4\u001b[11;59H2\u001b[11;67H4\u001b[11;69H6\u001b[11;85H\u001b[38;5;2;49m53%\u001b[11;92H\u001b[38;5;8;49m40k\u001b[11;109HGene\u001b[11;114Hal purpose text genera│\u001b[12;4H\u001b[38;5;5;49m● \u001b[12;7H\u001b[38;5;15;49mQwen/Qwen2.5-14B\u001b[12;24HInstruct\u001b[12;35H\u001b[38;5;8;49mAlibaba\u001b[12;49H\u001b[38;5;15;49m4.8B\u001b[12;57H7\u001b[12;67H8\u001b[12;69H2\u001b[12;85H\u001b[38;5;5;49m95%   \u001b[12;92H\u001b[38;5;8;49m131k\u001b[12;98H\u001b[38;5;5;49mMarginal  \u001b[12;109H\u001b[38;5;8;49mInst\u001b[12;114Huction following, chat│\u001b[13;4H\u001b[38;5;5;49m● \u001b[13;7H\u001b[38;5;15;49mQwen/Qwen2.5-32B-Instruct  \u001b[13;35H\u001b[38;5;8;49mAli\u001b[13;39Haba  \u001b[13;45H  \u001b[13;48H\u001b[38;5;15;49m32.5B\u001b[13;57H16.7 GB\u001b[13;68H8.2 GB\u001b[13;77H\u001b[38;5;3;49mCPU+GPU\u001b[13;85H\u001b[38;5;5;49m89%   \u001b[13;92H\u001b[38;5;8;49m131k\u001b[13;98H\u001b[38;5;5;49mMarginal  \u001b[13;136H\u001b[38;5;8;49m│\u001b[14;4H\u001b[38;5;5;49m● \u001b[14;7H\u001b[38;5;15;49mQwen/Qwen3-32B         \u001b[14;35H\u001b[38;5;8;49mAlibaba\u001b[14;49H\u001b[38;5;15;49m2.8B\u001b[14;58H6.8 GB\u001b[14;68H8.3 GB\u001b[14;77H\u001b[38;5;3;49mCPU+GPU\u001b[14;85H\u001b[38;5;5;49m89%   \u001b[14;93H\u001b[38;5;8;49m0k\u001b[14;98H\u001b[38;5;5;49mMarginal  \u001b[14;136H\u001b[38;5;8;49m│\u001b[15;4H\u001b[38;5;5;49m● \u001b[15;7H\u001b[38;5;15;49mdeepseek-ai/DeepSeek\u001b[15;28HR1\u001b[15;31HDi\u001b[15;35H\u001b[38;5;8;49mDeepSeek \u001b[15;49H\u001b[38;5;15;49m2.8B\u001b[15;57H16.8 GB\u001b[15;67H18.3 GB\u001b[15;77H\u001b[38;5;3;49mCPU+GPU\u001b[15;85H\u001b[38;5;5;49m89%   \u001b[15;92H\u001b[38;5;8;49m131k\u001b[15;98H\u001b[38;5;5;49mMarginal  \u001b[15;109H\u001b[38;5;8;49mAdvanc\u001b[15;116Hd reasoning, chain-o│\u001b[16;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;1;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen2.5-72B-Instruct  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m72.7B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m37.2 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m40.6 GB  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;1;48;5;8m465%  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m32k  \u001b[39;48;5;8m \u001b[38;5;1;48;5;8mToo Tight \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[22m\u001b[38;5;8;49m│\u001b[17;4H\u001b[39;49m  \u001b[17;7H                           \u001b[17;35H            \u001b[17;48H        \u001b[17;57H         \u001b[17;67H         \u001b[17;77H       \u001b[17;85H      \u001b[17;92H     \u001b[17;98H          \u001b[17;109H                           \u001b[38;5;8;49m│\u001b[18;4H\u001b[39;49m  \u001b[18;7H                           \u001b[18;35H            \u001b[18;48H        \u001b[18;57H         \u001b[18;67H         \u001b[18;77H       \u001b[18;85H      \u001b[18;92H     \u001b[18;98H          \u001b[18;109H                           \u001b[38;5;8;49m│\u001b[19;4H\u001b[39;49m  \u001b[19;7H                           \u001b[19;35H            \u001b[19;48H        \u001b[19;57H         \u001b[19;67H         \u001b[19;77H       \u001b[19;85H      \u001b[19;92H     \u001b[19;98H          \u001b[19;109H                           \u001b[38;5;8;49m│\u001b[20;4H\u001b[39;49m  \u001b[20;7H                           \u001b[20;35H            \u001b[20;48H        \u001b[20;57H         \u001b[20;67H         \u001b[20;77H       \u001b[20;85H      \u001b[20;92H     \u001b[20;98H          \u001b[20;109H                           \u001b[38;5;8;49m│\u001b[21;4H\u001b[39;49m  \u001b[21;7H                           \u001b[21;35H            \u001b[21;48H        \u001b[21;57H         \u001b[21;67H         \u001b[21;77H       \u001b[21;85H      \u001b[21;92H     \u001b[21;98H          \u001b[21;109H                           \u001b[38;5;8;49m│\u001b[22;4H\u001b[39;49m  \u001b[22;7H                           \u001b[22;35H            \u001b[22;48H        \u001b[22;57H         \u001b[22;67H         \u001b[22;77H       \u001b[22;85H      \u001b[22;92H     \u001b[22;98H          \u001b[22;109H                           \u001b[38;5;8;49m│\u001b[23;4H\u001b[39;49m  \u001b[23;7H                           \u001b[23;35H            \u001b[23;48H        \u001b[23;57H         \u001b[23;67H         \u001b[23;77H       \u001b[23;85H      \u001b[23;92H     \u001b[23;98H          \u001b[23;109H                           \u001b[38;5;8;49m│\u001b[24;4H\u001b[39;49"]
[0.000, "o", "m  \u001b[24;7H                           \u001b[24;35H            \u001b[24;48H        \u001b[24;57H         \u001b[24;67H         \u001b[24;77H       \u001b[24;85H      \u001b[24;92H     \u001b[24;98H          \u001b[24;109H                           \u001b[38;5;8;49m│\u001b[25;4H\u001b[39;49m  \u001b[25;7H                           \u001b[25;35H            \u001b[25;48H        \u001b[25;57H         \u001b[25;67H         \u001b[25;77H       \u001b[25;85H      \u001b[25;92H     \u001b[25;98H          \u001b[25;109H                           \u001b[38;5;8;49m│\u001b[26;4H\u001b[39;49m  \u001b[26;7H                           \u001b[26;35H            \u001b[26;48H        \u001b[26;57H         \u001b[26;67H         \u001b[26;77H       \u001b[26;85H      \u001b[26;92H     \u001b[26;98H          \u001b[26;109H                           \u001b[38;5;8;49m│\u001b[27;4H\u001b[39;49m  \u001b[27;7H                           \u001b[27;35H            \u001b[27;48H        \u001b[27;57H         \u001b[27;67H         \u001b[27;77H       \u001b[27;85H      \u001b[27;92H     \u001b[27;98H          \u001b[27;109H                           \u001b[38;5;8;49m│\u001b[28;2H\u001b[39;49m                                                                                                                                      \u001b[38;5;8;49m│\u001b[29;4H\u001b[39;49m  \u001b[29;7H                           \u001b[29;35H            \u001b[29;48H        \u001b[29;57H         \u001b[29;67H         \u001b[29;77H       \u001b[29;85H      \u001b[29;92H     \u001b[29;98H          \u001b[29;109H                           \u001b[38;5;8;49m│\u001b[30;4H\u001b[39;49m  \u001b[30;7H                           \u001b[30;35H            \u001b[30;48H        \u001b[30;57H         \u001b[30;67H         \u001b[30;77H       \u001b[30;85H      \u001b[30;92H     \u001b[30;98H          \u001b[30;109H                           \u001b[38;5;8;49m│\u001b[31;4H\u001b[39;49m  \u001b[31;7H                           \u001b[31;35H            \u001b[31;48H        \u001b[31;57H         \u001b[31;67H         \u001b[31;77H       \u001b[31;85H      \u001b[31;92H     \u001b[31;98H          \u001b[31;109H                           \u001b[38;5;8;49m│\u001b[32;4H\u001b[39;49m  \u001b[32;7H                           \u001b[32;35H            \u001b[32;48H        \u001b[32;57H         \u001b[32;67H         \u001b[32;77H       \u001b[32;85H      \u001b[32;92H     \u001b[32;98H          \u001b[32;109H                           \u001b[38;5;8;49m│\u001b[33;4H\u001b[39;49m  \u001b[33;7H                           \u001b[33;35H            \u001b[33;48H        \u001b[33;57H         \u001b[33;67H         \u001b[33;77H       \u001b[33;85H      \u001b[33;92H     \u001b[33;98H          \u001b[33;109H                           \u001b[38;5;8;49m│\u001b[34;4H\u001b[39;49m  \u001b[34;7H                           \u001b[34;35H            \u001b[34;48H        \u001b[34;57H         \u001b[34;67H         \u001b[34;77H       \u001b[34;85H      \u001b[34;92H     \u001b[34;98H          \u001b[34;109H                           \u001b[38;5;8;49m│\u001b[35;136H┘\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25h\u001b[5;3H"]
[0.010, "o", "\u001b[4;1H\u001b[38;5;8;49m┌ Search ────────────────────────────────────────────────────────┐\u001b[5;1H│\u001b[5;66H│\u001b[6;1H└────────────────────────────────────────────────────────────────┘\u001b[36;2H\u001b[1m\u001b[38;5;0;48;5;2mNORMAL\u001b[36;10H\u001b[22m\u001b[38;5;8;49m↑↓/jk:navig\u001b[36;22Hte \u001b[36;26HEnter:detail  /:search  f:fit filter  1-12:providers  q:quit\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.036, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.011, "o", "\u001b[15;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;5;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mdeepseek-ai/DeepSeek-R1-Dis\u001b[39;48;5;8m \u001b[38;5;8;48;5;8mDeepSeek    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m32.8B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m16.8 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m18.3 GB  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;5;48;5;8m89%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;5;48;5;8mMarginal  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAdvanced reasoning, chain-o\u001b[16;2H\u001b[22m\u001b[39;49m  \u001b[38;5;1;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen2.5-72B-Instruct  \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m72.7B   \u001b[39;49m \u001b[38;5;15;49m37.2 GB  \u001b[39;49m \u001b[38;5;15;49m40.6 GB  \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;1;49m465%  \u001b[39;49m \u001b[38;5;8;49m32k  \u001b[39;49m \u001b[38;5;1;49mToo Tight \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.015, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.041, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.018, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.001, "o", "\u001b[14;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;5;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen3-32B             \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m32.8B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m16.8 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m18.3 GB  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;5;48;5;8m89%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m40k  \u001b[39;48;5;8m \u001b[38;5;5;48;5;8mMarginal  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[15;2H\u001b[22m\u001b[39;49m  \u001b[38;5;5;49m● \u001b[39;49m \u001b[38;5;15;49mdeepseek-ai/DeepSeek-R1-Dis\u001b[39;49m \u001b[38;5;8;49mDeepSeek    \u001b[39;49m \u001b[38;5;15;49m32.8B   \u001b[39;49m \u001b[38;5;15;49m16.8 GB  \u001b[39;49m \u001b[38;5;15;49m18.3 GB  \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;5;49m89%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;5;49mMarginal  \u001b[39;49m \u001b[38;5;8;49mAdvanced reasoning, chain-o\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.010, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.014, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.034, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.008, "o", "\u001b[13;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;5;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen2.5-32B-Instruct  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m32.5B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m16.7 GB  \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m18.2 GB  \u001b[39;48;5;8m \u001b[38;5;3;48;5;8mCPU+GPU\u001b[39;48;5;8m \u001b[38;5;5;48;5;8m89%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;5;48;5;8mMarginal  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[14;2H\u001b[22m\u001b[39;49m  \u001b[38;5;5;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen3-32B             \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m32.8B   \u001b[39;49m \u001b[38;5;15;49m16.8 GB  \u001b[39;49m \u001b[38;5;15;49m18.3 GB  \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;5;49m89%   \u001b[39;49m \u001b[38;5;8;49m40k  \u001b[39;49m \u001b[38;5;5;49mMarginal  \u001b[39;49m \u001b[38;5;8;49mGeneral purpose text genera\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.019, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.037, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.019, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[12;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;5;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen2.5-14B-Instruct  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m14.8B   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m7.6 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.2 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;5;48;5;8m95%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m131k \u001b[39;48;5;8m \u001b[38;5;5;48;5;8mMarginal  \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mInstruction following, chat\u001b[13;2H\u001b[22m\u001b[39;49m  \u001b[38;5;5;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen2.5-32B-Instruct  \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m32.5B   \u001b[39;49m \u001b[38;5;15;49m16.7 GB  \u001b[39;49m \u001b[38;5;15;49m18.2 GB  \u001b[39;49m \u001b[38;5;3;49mCPU+GPU\u001b[39;49m \u001b[38;5;5;49m89%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;5;49mMarginal  \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.042, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.035, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.035, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.019, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.014, "o", "\u001b[11;2H\u001b[1m\u001b[39;48;5;8m▶ \u001b[38;5;2;48;5;8m● \u001b[39;48;5;8m \u001b[38;5;15;48;5;8mQwen/Qwen3-8B              \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mAlibaba     \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m8.2B    \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.2 GB   \u001b[39;48;5;8m \u001b[38;5;15;48;5;8m4.6 GB   \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mGPU    \u001b[39;48;5;8m \u001b[38;5;2;48;5;8m53%   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8m40k  \u001b[39;48;5;8m \u001b[38;5;2;48;5;8mPerfect   \u001b[39;48;5;8m \u001b[38;5;8;48;5;8mGeneral purpose text genera\u001b[12;2H\u001b[22m\u001b[39;49m  \u001b[38;5;5;49m● \u001b[39;49m \u001b[38;5;15;49mQwen/Qwen2.5-14B-Instruct  \u001b[39;49m \u001b[38;5;8;49mAlibaba     \u001b[39;49m \u001b[38;5;15;49m14.8B   \u001b[39;49m \u001b[38;5;15;49m7.6 GB   \u001b[39;49m \u001b[38;5;15;49m8.2 GB   \u001b[39;49m \u001b[38;5;2;49mGPU    \u001b[39;49m \u001b[38;5;5;49m95%   \u001b[39;49m \u001b[38;5;8;49m131k \u001b[39;49m \u001b[38;5;5;49mMarginal  \u001b[39;49m \u001b[38;5;8;49mInstruction following, chat\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.010, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.033, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.019, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.017, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.016, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.021, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.027, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.050, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.051, "o", "\u001b[39m\u001b[49m\u001b[59m\u001b[0m\u001b[?25l"]
[0.012, "o", "\u001b[?1049l\u001b[?1006l\u001b[?1015l\u001b[?1003l\u001b[?1002l\u001b[?1000l\u001b[?25h"]
[0.006, "x", "0"]