人工智能相關(guān)文章 DeepSeek開源周第二日:開源首個用于MoE模型訓(xùn)練通信庫 今天是DeepSeek開源周第二日,一早,DeepSeek如約就放出了開源代碼庫DeepEP王炸。 據(jù)了解,DeepEP是首個用于 MoE 模型訓(xùn)練和推理的開源 EP 通信庫,它填補了MoE模型專用通信工具的空白,為大規(guī)模分布式AI訓(xùn)練和實時推理場景提供了更高效的底層支持。 發(fā)表于:2/25/2025 上海明星AI公司瀾碼科技被曝員工停薪社保停繳 2 月 25 日消息,據(jù)極速財訊報道,曾頂著“李開復(fù)關(guān)門弟子”、“ACM 世界冠軍”光環(huán)的周健和他的明星 AI 公司瀾碼科技現(xiàn)在陷入輿論漩渦。 發(fā)表于:2/25/2025 Anthropic發(fā)布全球首個混合推理模型Claude 3.7 Sonnet 2月25日消息,據(jù)報道,Anthropic發(fā)布了全球首款混合推理模型、迄今為止最好的編碼模型——Claude 3.7 Sonnet。 據(jù)官方介紹,該模型以其獨特的“一個模型,兩種思考方式”(One model, two ways to think)設(shè)計理念,為用戶提供了標準和擴展兩種思考模式,允許用戶根據(jù)需求靈活選擇模型的響應(yīng)方式:既可以是近乎即時的快速回答,也可以是經(jīng)過深度思考的逐步推理結(jié)果。 發(fā)表于:2/25/2025 微軟回應(yīng)大砍算力AI傳聞 本周一,微軟重申將堅持其800多億美元的資本支出計劃,但同時承認可能會在某些領(lǐng)域戰(zhàn)略性地調(diào)整或放緩基礎(chǔ)設(shè)施建設(shè)。 此前報道稱,TD Cowen分析師近日發(fā)布報告指出,微軟已經(jīng)取消了與多個私營數(shù)據(jù)中心運營商的數(shù)項租賃協(xié)議,涉及功率總計數(shù)百兆瓦。TD Cowen認為,這些舉動表明,微軟可能正處于數(shù)據(jù)中心“供應(yīng)過?!钡木置?。 發(fā)表于:2/25/2025 兆芯全系整機成功部署DeepSeek-R1 2月24日消息,兆芯官方宣布,基于兆芯處理器的PC筆記本/臺式機終端、工作站、服務(wù)器,已經(jīng)全系成功實現(xiàn)DeepSeek-R1 Distill模型的本地部署,涵蓋1.5B、7B、14B、32B、70B、671B等各種參數(shù)規(guī)模。 操作系統(tǒng)方面,兆芯原生支持Linux、Windows、各家國產(chǎn)操作系統(tǒng),并適配國產(chǎn)GPU AI加速卡。 發(fā)表于:2/25/2025 阿里宣布未來3年將投入超3800億元用于AI和云計算基礎(chǔ)設(shè)施 2月24日,阿里巴巴集團CEO吳泳銘宣布,未來三年,阿里將投入超過3800億元,用于建設(shè)云和人工智能(AI)硬件基礎(chǔ)設(shè)施,總額將超過去十年總和。這也創(chuàng)下了中國民營企業(yè)在云和AI硬件基礎(chǔ)設(shè)施建設(shè)領(lǐng)域有史以來最大規(guī)模投資。 值得注意的是,阿里巴巴此次投資正值兩個重要時間節(jié)點:一是DeepSeek火爆全球,帶動國內(nèi)AI產(chǎn)業(yè)快速發(fā)展;二是本月17日,民營企業(yè)座談會在北京舉行,提振了民營經(jīng)濟的干勁與信心。 吳泳銘表示,“AI爆發(fā)遠超預(yù)期,國內(nèi)科技產(chǎn)業(yè)方興未艾,潛力巨大。阿里巴巴將不遺余力加速云和AI硬件基礎(chǔ)設(shè)施建設(shè),助推全行業(yè)生態(tài)發(fā)展。”目前,阿里云是亞洲頭部云計算公司,阿里巴巴通義千問大模型已成為全球知名的開源模型。 發(fā)表于:2/25/2025 e絡(luò)盟擴展產(chǎn)品組合 強化工業(yè)產(chǎn)品類別 中國上海,2025 年 2月20日 — 安富利旗下全球電子元器件產(chǎn)品與解決方案分銷商e絡(luò)盟擴展了其工業(yè)和維護、維修和運營 (MRO) 產(chǎn)品范圍,以確??蛻裟軌驈男袠I(yè)領(lǐng)先的供應(yīng)商處獲得各種產(chǎn)品和解決方案。 發(fā)表于:2/24/2025 展望2025:人工智能將改變數(shù)據(jù)中心建設(shè)的方式 回望2024,人工智能(AI)對行業(yè)產(chǎn)生的影響顯露無疑。去年,數(shù)據(jù)中心對AI計算的需求呈指數(shù)級增長,這將促使行業(yè)采用更高效的流程,加快構(gòu)建速度,并更具創(chuàng)造性地解決問題。如今看來,這一預(yù)測不僅成真,而且實際趨勢比我們當初預(yù)想的還要顯著。2025年,行業(yè)對更高效戰(zhàn)略的需求已經(jīng)十分明顯。目前,有一些重大的舉措和雄心勃勃的計劃已經(jīng)成形,數(shù)據(jù)中心建設(shè)的變革將助力云計算繼續(xù)進階。 發(fā)表于:2/24/2025 DeepSeek今日啟動開源周 2月24日消息,據(jù)報道,DeepSeek宣布啟動“開源周”,首個開源的代碼庫為Flash MLA。 這是一個針對Hopper GPU優(yōu)化的高效MLA解碼內(nèi)核,專為處理可變長度序列而設(shè)計,目前已投入實際生產(chǎn)應(yīng)用。 發(fā)表于:2/24/2025 龍芯DeepSeek大模型推理一體機發(fā)布 2 月 23 日消息,據(jù)龍芯安徽公眾號,龍芯中科成功發(fā)布基于 DeepSeek 大模型的軟硬全棧推理一體機。產(chǎn)品基于龍芯自主指令系統(tǒng)架構(gòu)(LoongArch)3C5000 處理器,搭載太初元碁 T100 加速卡,支持 DeepSeek 全系大模型及其它主流大模型。 發(fā)表于:2/24/2025 超20家央企接入DeepSeek 2 月 24 日消息,據(jù)經(jīng)濟參考報報道,近來,國資央企“牽手”DeepSeek 已成為一股新風(fēng)潮。據(jù)不完全統(tǒng)計,目前有超 20 家央企接入 DeepSeek,涉及能源、通信、汽車、金融、建筑等多個領(lǐng)域。 發(fā)表于:2/24/2025 DeepSeek超越150萬模型成全球最受歡迎開源大模型 2月24日消息,今天凌晨3點,全球最大開源平臺之一huggingface聯(lián)合創(chuàng)始人兼首席執(zhí)行官Clement Delangue發(fā)布了最新數(shù)據(jù):中國開源大模型DeepSeek-R1在150萬模型中,成為該平臺最受歡迎的開源大模型,點贊超過1萬。 前不久,Clement還特意發(fā)文恭喜DeepSeek-R1的下載量超過1000萬次,同樣創(chuàng)造了huggingface平臺有史以來最受歡迎的模型。 發(fā)表于:2/24/2025 Arm Ethos-U85 NPU:利用小語言模型在邊緣側(cè)實現(xiàn)生成式 AI 隨著人工智能 (AI) 的演進,利用小語言模型 (SLM) 在嵌入式設(shè)備上執(zhí)行 AI 工作負載成為業(yè)界關(guān)注的焦點。Llama、Gemma 和 Phi3 等小語言模型,憑借其出色的成本效益、高效率以及在算力受限設(shè)備上的易部署性,贏得了廣泛認可。Arm 預(yù)計這類模型的數(shù)量將在 2025 年繼續(xù)增長。 發(fā)表于:2/23/2025 意法半導(dǎo)體為數(shù)據(jù)中心和AI集群帶來更高性能的云光互連技術(shù) 2025 年 2 月 20 日,中國 —— 服務(wù)多重電子應(yīng)用領(lǐng)域、全球排名前列的半導(dǎo)體公司意法半導(dǎo)體 (STMicroelectronics,簡稱ST;紐約證券交易所代碼:STM) 推出了新一代專有硅光技術(shù),為數(shù)據(jù)中心和 AI 集群帶來性能更高的光互連解決方案。隨著 AI 計算需求的指數(shù)級增長,計算、內(nèi)存、電源以及這些資源的互連都面臨著性能和能效的挑戰(zhàn)。意法半導(dǎo)體新推出的硅光技術(shù)和新一代 BiCMOS 技術(shù)可以幫助云計算服務(wù)商和光模塊廠商克服這些挑戰(zhàn)。計劃從 2025 年下半年開始,800Gb/s 和 1.6Tb/s 光模塊將逐步提升產(chǎn)量。 發(fā)表于:2/23/2025 昆侖芯單機可部署滿血版DeepSeek R1 昆侖芯作為國產(chǎn)高性能AI芯片,是國內(nèi)率先支持單機部署滿血版DeepSeek R1的國產(chǎn)芯,率先支持 8bit 推理,可提供精度無損的推理服務(wù),單機8卡配置便可實現(xiàn) 2437 tokens/s 吞吐,在性能、功耗和部署靈活性上達到行業(yè)領(lǐng)先水平,滿足輕量化與極致效價比需求,業(yè)界價格最低! 發(fā)表于:2/21/2025 ?…567891011121314…?