张二嘎 发表于 7 天前

AI 上周热点#013



AI 总结
Meta发布Llama 4模型。亚马逊推出Nova Act,用于控制浏览器。Adobe Premiere Pro更新,加入Generative Extend等AI功能。OpenAI付费用户激增,营收有望在2025年翻三倍。Runway、Midjourney、ByteDance、微软等公司发布新AI模型或功能,Nvidia的H20芯片订单价值160亿美元,Isomorphic Labs融资6亿美元用于AI药物研发等。

以下全文
Meta 发布 Llama 4,新一代旗舰 AI 模型
https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/123806fu6df83srcuup38z.png
Meta 推出了全新 AI 模型套件 Llama 4,其中包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。这些模型在大量未标记的文本、图像和视频数据上进行了训练,以增强其视觉理解能力。Llama 4 模型是首批使用混合专家 (MoE) 架构的模型,该架构通过将数据处理任务分配给更小、更专业的模型来提高计算效率。然而,由于欧盟的区域性 AI 和数据隐私法律,这些模型的使用在欧盟受到限制,并且每月活跃用户超过 7 亿的公司必须获得 Meta 的特别许可。尽管吹捧了良好的基准测试性能,但 Llama 4 在人工智能界因其看似表现平平而受到批评。甚至有作弊的传言,以至于一个Meta高管不得不明确否认公司人为提高了Llama 4的基准测试分数
https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/123823daqxjp2mxy3zdpsa.jpg

亚马逊推出 Nova Act,一个可以控制网络浏览器的 AI 智能体
https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/123842vyd1osirstrtnj1s.jpg
亚马逊推出了 Nova Act,这是一款通用人工智能代理,能够控制网络浏览器并独立执行简单任务。 Nova Act 由亚马逊的 AGI 实验室开发,将成为即将推出的 Alexa+ 升级版(亚马逊语音助手的 AI 增强版)的关键组成部分。 亚马逊还发布了 Nova Act SDK,开发人员可以使用它构建代理原型,使 AI 代理能够浏览网页、填写表格以及在日历上安排日期。 尽管市场竞争激烈,亚马逊声称在多项内部测试中,Nova Act 的性能优于 OpenAI 和 Anthropic 类似代理。

Adobe 发布 Premiere Pro 的生成式 AI 视频扩展
https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/123901ivc7031cvbasas31.jpg
Adobe 发布了 Premiere Pro 25.2 版本,引入了旨在增强视频编辑的 AI 驱动功能。其中最显著的增加是 Generative Extend,这是一个由 Adobe 的 Firefly 生成式 AI 视频模型驱动的工具,允许用户将视频剪辑延长最多两秒,并将环境背景音频延长最多十秒。在有限的时间内,此功能是免费的,之后用户将需要使用 Firefly 生成式积分。此次更新还包括一个 AI 驱动的搜索面板,该面板可以识别剪辑的内容,使用户能够使用文本描述来搜索素材。此外,Premiere Pro 现在可以自动将视频字幕翻译成 27 种语言,并在 Apple 芯片和 Windows 设备上提供更快的速度和性能。

OpenAI 的收入将在付费 ChatGPT 用户激增后增长两倍
https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/123921nlljxytzvwnl4jn0.jpg
OpenAI 的 ChatGPT 付费订阅用户增加了 30%,从上一季度的 1550 万增加到超过 2000 万。这一激增导致月收入相应增长 30%,从 3.33 亿美元增至 4.15 亿美元。该公司最近的估值为 3000 亿美元,此前由软银领投,微软支持的一轮融资规模为 400 亿美元。OpenAI 还透露,每周有超过 5 亿人使用 ChatGPT。OpenAI 预计收入将大幅扩张,预计其总收入将从 2024 年的 37 亿美元增加到 2025 年的 127 亿美元,增长两倍,并预计在 2026 年产生 294 亿美元的收入。

Runway 推出 Gen-4 Turbo 视频 AI 模型,生成速度更快
Runway 的 Gen-4 Turbo AI 模型显著提升了视频生成速度和效率,在视频场景中提供了改进的连贯性和真实感,同时比其前代产品更节省算力。

OpenAI 为 ChatGPT 用户准备推理滑块和记忆更新
OpenAI 正在通过改进 ChatGPT 的功能来增强其功能,例如改进记忆功能以实现上下文感知交互、用于任务复杂性的推理滑块以及用于让用户了解更新的通知源。

谷歌的 AI 模式现在可以用图像进行查看和搜索
谷歌的AI模式现在整合了Gemini AI和Lens技术,以增强基于图像的搜索功能,通过分析图像中的上下文和关系提供详细的回复和建议。

字节跳动DreamActor-M1 将图像转化为令人惊叹的真人视频
字节跳动推出的新框架 DreamActor-M1 使用 Diffusion Transformer 架构,从图像生成逼真的人物动画,性能优于现有模型,同时解决了伦理问题和动态摄像机运动等局限性。

微软更新Copilot,整合其他AI的精华
微软的 Copilot 正在通过记忆、个性化、网络操作和播客创作等功能进行增强,以便更好地与 ChatGPT 和 Claude 等人工智能替代品竞争。

Midjourney 发布了新的 V7 AI 图像模型,可以更好地处理文本提示
Midjourney 的 V7 AI 图像模型引入了增强的文本提示处理、改进的图像质量,以及诸如草稿模式等新功能,可实现更快、更具成本效益的迭代,同时个性化选项允许用户根据其视觉偏好定制 AI。

阿里巴巴准备最早于 4 月发布旗舰 AI 模型
阿里巴巴集团控股有限公司计划于本月发布其旗舰人工智能模型 Qwen 3 的升级版,此前来自包括 OpenAI 和 DeepSeek 在内的竞争对手的竞争正在升温。

中国智谱推出免费 AI 智能体Manus
中国智谱公司正在免费开放其新的人工智能代理,国内构建新兴人工智能技术的竞争日益激烈。这家总部位于北京的初创公司周一推出了 AutoGLM,这是一款可以进行深入研究的人工智能代理。

https://static-beesseek.oss-cn-hangzhou.aliyuncs.com/forum/202504/11/124019cqbaadbbazh6v9dd.jpg
英伟达 H20 芯片:来自字节跳动、阿里巴巴和腾讯的 160 亿美元订单
尽管受到美国的出口限制,中国的科技巨头字节跳动、阿里巴巴和腾讯已经大量订购了英伟达的 H20 服务器芯片,这得益于中国快速扩张的 AI 产业。

据报道,英特尔和台积电将推出合资芯片制造企业
英特尔和台积电正在组建合资企业,运营英特尔的芯片制造设施,台积电将贡献专业知识和培训,而非资本,此举正值在新任首席执行官谭励保的领导下,重振英特尔的努力之中。

谷歌支持的Isomorphic Labs融资6亿美元以推进人工智能药物研发
Isomorphic Labs 已筹集 6 亿美元,以加速其 AI 药物设计引擎的开发,并将其项目推进到临床开发阶段,这正值制药行业 AI 集成趋势日益增长之际。

视频初创公司 Runway 在融资轮中估值 30 亿美元
Runway AI Inc. 已在新一轮融资中筹集了 3.08 亿美元,这使得该公司的估值翻了一倍以上——这表明投资者对开发能够生成视频的人工智能软件的初创公司的热情。

Spotify 推出 Gen AI 广告、程序化广告购买
Spotify 正在通过 Gen AI 广告和 Spotify 广告交易平台增强其广告业务,从而实现实时竞价以及 AI 生成的脚本和配音,以更好地定位其庞大的 Z 世代用户群。

谷歌 Gemini AI 领导层变动
谷歌的人工智能部门正在进行领导层变动,Josh Woodward将接替Sissie Hsiao,专注于推进Gemini应用,因为人工智能竞赛强调产品开发和模型创新。

DeepMind 已在阻止发布 AI 研究,以给 Google 带来优势
DeepMind 已经实施了更严格的发布政策,以保持谷歌在人工智能行业的竞争优势,推迟了战略研究论文的发布。














页: [1]
查看完整版本: AI 上周热点#013