Aquileo | sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP · RTX5090 performence and setup

RTX5090 performence and setup

#14
by jasionkajakub - opened

chuja wart jest ten quant, wypierdala sie na opencode/claude przy kilku stepach na tool callingu, halucynuje i rozpierdala tool calle + silent fail. gowno nie polecam. Oryginal fp8 i dziala jak bajeczka

https://huggingface.co/sakamakismile/Qwen3.6-27B-Text-NVFP4-MTP/discussions/9#69f14fa77093aee750bddd07 Jak ogarniesz zestaw .ninja to działa jak marzenie. Używam w openclaw bez problemu robi 120 iteracji w sesji i wraca z dobrą odpowiedzią obsługuje też rag i innych agentów, jak chcesz lepszą jakość to pobierz sobie wersje 25gb grze wszystkie 16 warstw linear attention masz w bf16 a pozostałe 24 w nvfp4

Sign up or log in to comment