3月9日消息,從超算互聯(lián)網(wǎng)官微獲悉,本周,超算互聯(lián)網(wǎng)平臺上線阿里巴巴開源推理模型QwQ-32B API接口服務(wù),現(xiàn)在用戶可獲得免費(fèi)的100萬Tokens。
據(jù)了解,基于國產(chǎn)深算智能加速卡以及全國一體化算力網(wǎng),平臺支持海量用戶便捷調(diào)用QwQ-32B、DeepSeek-R1等國產(chǎn)開源大模型的接口服務(wù)。
超算互聯(lián)網(wǎng)QwQ-32B API接口服務(wù)頁面
超算互聯(lián)網(wǎng)QwQ-32B模型鏡像創(chuàng)建頁面
超算互聯(lián)網(wǎng)AI社區(qū)QwQ-32B模型快速開發(fā)頁面
用戶無需下載本地,只需一鍵啟動(dòng)Notebook功能,即可在平臺快速開發(fā)QwQ-32B模型,或引入專有數(shù)據(jù)進(jìn)一步私有化部署。
QwQ-32B是阿里Qwen團(tuán)隊(duì)最新發(fā)布的推理模型,基于Qwen2.5-32B+強(qiáng)化學(xué)習(xí)構(gòu)建。
據(jù)官方公示的基準(zhǔn)評測結(jié)果,在測試數(shù)學(xué)能力的 AIME24 評測集上,以及評估代碼能力的LiveCodeBench中,QwQ-32B表現(xiàn)與DeepSeek-R1相當(dāng),遠(yuǎn)勝于o1-mini 及相同尺寸的R1蒸餾模型。
QwQ-32B API調(diào)用服務(wù)具體步驟如下:
1、用戶在超算互聯(lián)網(wǎng)商城首頁中搜索QwQ-32B,點(diǎn)擊“QwQ-32B 接口服務(wù)”商品,購買完成后,點(diǎn)擊“去使用”。
2、進(jìn)入API接口信息頁面:點(diǎn)擊“去使用”后會(huì)進(jìn)入API接口信息頁面。
3、按需選擇訪問形式,有三種訪問形式可選:使用Postman、Apifox等http工具訪問;使用python代碼訪問;以及在終端頁面直接訪問。
目前,超算互聯(lián)網(wǎng)除提供QwQ-32B模型API接口服務(wù)外,近期還上線有DeepSeek-R1全家桶、最高671B滿血版的API部署與AI Web應(yīng)用服務(wù)。
3月6日,阿里巴巴通義千問最新開源模型QwQ-32B正式發(fā)布,擁有比DeepSeek更小的尺寸,性能卻可比肩全球最強(qiáng)開源推理模型。
據(jù)了解,通過大規(guī)模強(qiáng)化學(xué)習(xí),千問QwQ-32B在數(shù)學(xué)、代碼及通用能力上實(shí)現(xiàn)質(zhì)的飛躍,整體性能比肩DeepSeek-R1。
而且在保持強(qiáng)勁性能的同時(shí),千問QwQ-32B還大幅降低了部署使用成本,在消費(fèi)級顯卡上也能實(shí)現(xiàn)本地部署。
目前,阿里已采用寬松的Apache2.0協(xié)議,將千問QwQ-32B模型向全球開源,所有人都可免費(fèi)下載及商用。