隐藏置顶帖
置顶
一起港湾 (17GW.com) 论坛发帖须知
欢迎来到 一起港湾 (17GW) 社区!这里是 AI 技术爱好者、数码极客和生活分享者的精神家园。为了维护港湾的纯净秩序与技术氛围,请在开启您的分享之旅前,仔细阅读并遵守以下发帖规范。
一、 核心发帖准则
[*]主题契合,精准归类:请确保内容与所属版块(如 AI 技术、数码维修、资源分享等)相关。标题应简明扼要,避免“ ...
GPU霸权将被超大内存架构取代,AI芯片迎来内存革命!
【GPU霸权将被超大内存架构取代,AI芯片迎来内存革命!】
AI芯片的技术演进正站在重大拐点之上 。
被誉为“HBM之父”的韩国科学技术院电气与电子工程学院教授金正浩近日公开表示,未来AI算力体系将发生结构性重构——主导权正从处理器转向内存 。
目前以英伟达GPU和通用CPU为核心的计算范式,将在中长期被一种全新的内 ...
#英特尔CPU进入英伟达新一代旗舰主机#
【#英特尔CPU进入英伟达新一代旗舰主机#】
圣何塞举办的NVIDIA GTC 2026大会上,Intel正式宣布一项重磅合作,其Xeon 6(至强6)处理器将成为NVIDIA下一代旗舰AI服务器系统DGX Rubin NVL8的主机CPU。据悉,DGX Rubin NVL8是NVIDIA新一代旗舰AI服务器系统,主打智能体AI和推理系统等新兴应用场景。在这套系统中,主机CPU的作 ...
字节跳动PICOOS6预告发布#,今年还将推出全新 XR 旗舰产品“Project Swan
【#字节跳动PICOOS6预告发布#,今年还将推出全新 XR 旗舰产品“Project Swan”】字节跳动 PICO-XR 官方今日正式预告了下一代空间操作系统 —— PICO OS 6,并宣布将在 2026 年推出全新 XR 旗舰产品 —— Project Swan(内部代号)。 ##
...
intel 显卡现在对 AI 的支持怎么样了?
看到 pytorch 2.5 正式支持 intel 了,但是搜了下没看到太多讨论,有用过的分享一下使用体验吗?
主要是眼馋显存,想买个来玩玩 AI 绘图,训练 lora 啥的
英特尔联手 SambaNova 推出异构 AI 推理硬件解决方案,结合三种处理器
New
【英特尔联手 SambaNova 推出异构 AI 推理硬件解决方案,结合三种处理器】其结合了用于预填充的 GPU、用于解码的 SambaNova SN50 RDU、用于主机头节点和“动作”的英特尔至强 Xeon 6 处理
器,为推理负载的每个步骤选用最合适的硬件。
...
谷歌 TPU 明年将进入新世代#,台ODM 厂筹备新商机
New
【#谷歌 TPU 明年将进入新世代#,台ODM 厂筹备新商机】 ##
Google 全新 ASIC 计算芯片 TPU 明年将进入 v8 世代,中国台湾地区 ODM 厂整军备战 ASIC 服务器商机。业界推估,TPU v8 架构的 ASIC 服务器今年底前将进入备货阶段,明年初放量出货;TPU v9 明年亮相,成为 ODM 厂在 2028 年的主攻产品。
Google 冲刺自有 ASIC ...
苹果自研AI服务器芯片曝光#:直接采购三星玻璃基板,把控封装质量
New
【#苹果自研AI服务器芯片曝光#:直接采购三星玻璃基板,把控封装质量】芯片通信方面交由博通(Broadcom)开发,负责解决各处理器协同运行时的通信问题;而三星电机(Samsung Electro-Mechanics)负责提供 T-glass 玻璃基板,并最终由台积电生产封装。
...
哈哈,出炉了。 学习了两天做了一个土豆子的产品视频。
New
哈哈,出炉了。
学习了两天做了一个土豆子的产品视频。
和之前即梦、Sora 不一样的是,这个是生产力方向的。
一步一步按照我的要求生成我想要的东西。
你们感觉效果怎么样?
http://t.cn/AXMzTNRI
Mac 跑 AI 模型更方便了,Tiny Corp 称苹果已为英伟达、AMD 外置显卡开绿灯
New
【Mac 跑 AI 模型更方便了,Tiny Corp 称苹果已为英伟达、AMD 外置显卡开绿灯】该驱动并非来自 GPU 厂商,而是由 Tiny Corp 自主开发,因此其主要面向 AI 大模型运算,而非游戏用途。
微软和谷歌正寻求与SK海力士达成长期协议
New
微软和谷歌正寻求与SK海力士达成长期协议
SK海力士正与包括微软和谷歌在内的全球主要人工智能公司签订DRAM长期供应协议(LTA)。大型科技公司正试图锁定DRAM这种价格波动剧烈的产品,以延长其供应期限。随着全球人工智能基础设施投资热潮的兴起,人们对DRAM供应短缺的担忧日益加剧,大型科技公司正在制定战略,以确保稳定 ...
5小时众筹破百万美金,Tiiny AI为什么能卖爆
New
“我们没想到端侧AI会火的这么快。”
3月末,Tiiny AI副总裁兼商业化负责人Eco Lee向虎嗅复盘了这款在Kickstarter上迅速爆火的项目时感慨道。
3月中旬,Tiiny AI Pocket Lab小盒子在Kickstarter上线,售价1399美金起,上线仅5小时众筹突破100万美元。上一次在该平台跑出同等速度的,还是2022年的拓竹Bambu Lab X1。短短四 ...
Gemma4对高通是巨大利好
New
Gemma4对高通是巨大利好
谷歌新出的Gemma4大模型,就是给高通量身定做的“赚钱神器”,对高通来说,完完全全是天上掉馅饼的大好事。
以前的AI大模型又大又笨,只能在服务器上跑,手机根本带不动。而Gemma4是轻量化小模型,专门能在手机、汽车这些终端设备上离线运行,不用靠网络,反应还快,这刚好戳中了高通的核心优 ...
MWC展出的AI算力玩家的产品具象化一下吧。
New
MWC展出的AI算力玩家的产品具象化一下吧。
平时都在机房里面堆着你们也不怎么看的到。
Nvidia,AMD,Supermicro,Giagbyte,Qualcomm(这是意外,高通all in搞推理了?头脑还是清醒的,知道下半场在哪里),联发科等等。
## http://t.cn/AXf2C6vc
...
英伟达的B300服务器,最近一个月,单台报价就上涨超过100万以上(短短一个月内),市场的公开报价从400多万一台,暴涨到500多万了。
New
英伟达的B300服务器,最近一个月,单台报价就上涨超过100万以上(短短一个月内),市场的公开报价从400多万一台,暴涨到500多万了。不过,内存条的价格是下来了一些了,目前市场稀缺的只有高端的AI芯片了(因为AI的应用需求在大幅上升,各大公司也在疯狂的因为AI应用大幅落地而不断裁员优化)
附英伟达B300服务器的参考配 ...
今天去聊了几个做GPU云服务的厂商,最大的感受就是顶级算力已经贵到离谱了。
New
今天去聊了几个做GPU云服务的厂商,最大的感受就是顶级算力已经贵到离谱了。前几个月拿的几个node感觉已经血赚……
现在 B200 和下一代 Vera Rubin 的需求非常高,高到很多资源已经不是按节点往外卖了,基本上就是整柜起订,一个机柜、一个 NVL72 去谈。交付周期也很夸张,你想临时拿几个node,基本很难。
更夸张的是价 ...
只要在电脑的PCIe 插个卡
New
只要在电脑的PCIe 插个卡
就能用上 Qwen 3.5-27B 10000token/S 超级体验
超低功耗
400 刀左右的价格
Taala新出的把大模型焊死到芯片里实现的高效计算
感觉这个卡的需求会非常大
好想搞到一个,体验下 token 自由的感觉
1000 刀也值
...
网传“Rubin Ultra从4颗GPU减配到2颗、技术无法实现”,目前只是上游渠道传闻,并非英伟达官方确认
网传“Rubin Ultra从4颗GPU减配到2颗、技术无法实现”,目前只是上游渠道传闻,并非英伟达官方确认;且“所有配套都砍半”是过度线性外推,实际影响远没那么极端。
一、先理清Rubin Ultra的基本信息
- 官方规划(GTC 2026):单颗Rubin Ultra为4颗GPU芯粒(chiplet)封装,配1TB HBM4e,计划2027年下半年量产
- 网传 ...
Ollama 官方消息:Ollama 0.19 开始使用苹果的 MLX 作为后端
Ollama 官方消息:Ollama 0.19 开始使用苹果的 MLX 作为后端,所以能更好地利用统一内存和 GPU 加速,在有 32G 内存的 M5 系列设备上运行 int4 量化的 Qwen3.5-35B-A3B 可以实现预填充 1851 token/s,生成 134 token/s。 http://t.cn/AXIKNdVW
Mac可以用外接GPU来跑大模型了。
Mac可以用外接GPU来跑大模型了。
文档: docs.tinygrad.org/tinygpu/
#How I AI#
“HBM 之父”金正浩:AI 芯片格局将发生根本性变化,内存会取代 GPU 主角地位
【“HBM 之父”金正浩:AI 芯片格局将发生根本性变化,内存会取代 GPU 主角地位】4 月 1 日消息,当地时间 3 月 30 日,据韩媒《亚洲经济》报道,被称为“HBM 之父”的韩国科学技术院电气与电子工程学院教授金正浩表示,AI 芯片格局即将发生根本性变化,当前以英伟达 GPU 为核心的体系,将被内存主导的架构取代。
金正浩 ...