字节跳动开源Lance:30亿参数统一多模态模型,图文视频生成理解一体化 字节跳动开源了一款30亿参数的多模态模型Lance,尝试以单一架构同时覆盖图像和视频的理解、生成与编辑,而非采用业界常见的多模型拼接路由方案。目前代码已可在GitHub获取,性能细节与许可协议尚待进一步披露。 2026-05-20 🔭 科技见闻 4
秒级音频生成:Stability AI 开源 Stable Audio 3,支持分钟级合成与局部编辑 Stability AI 发布开源音频生成模型 Stable Audio 3,可在消费级硬件上实现秒级分钟级音频合成,支持 variable-length 生成与 inpainting 编辑,已开放 small/medium 两档权重与训练代码。 2026-05-20 🔭 科技见闻 3
Firefox 148 禁用 asm.js 优化:OdinMonkey 迎来黄昏 Mozilla 宣布自 Firefox 148 起默认禁用 SpiderMonkey 的 asm.js 优化,并计划在未来版本中彻底移除相关代码。asm.js 是 2013 年为实现网页原生级性能而生的 JavaScript 子集,为 WebAssembly 的出现奠定了基础;随着后者成熟,维护双路径已成累赘。现有 asm.js 代码仍可通过常规 JIT 运行,但建议迁移至 WebAssembly。 2026-05-20 🔭 科技见闻 8
用 AI 写 10 万行 Rust 代码:multi-Paxos 引擎的开发经验与契约验证方法 开发者用 Claude Code、Codex 等 AI 工具,在约 4 周内编写了 10 万行 Rust 代码,实现了一个生产级 multi-Paxos 一致性引擎,性能提升 13 倍。核心经验是通过代码契约(前置/后置条件+属性测试)确保复杂分布式系统的正确性,并采用轻量级规格驱动开发替代僵硬的文档流程。 2026-05-20 🔭 科技见闻 11
前OpenAI创始人Karpathy加入Anthropic预训练团队 前OpenAI联合创始人Andrej Karpathy重返大模型前沿,加入Anthropic预训练团队。一个月前他在No Priors播客中曾表达回归意趣。此举被视为AI人才流动的标志性事件,或影响行业对两家公司的认知。 2026-05-20 🔭 科技见闻 0
Google I/O 2026:Gemini 3.5 Flash 成默认模型,AI 搜索迈向「任务执行」 Google I/O 2026 聚焦 AI 全生态:Gemini 3.5 Flash 成为默认模型,月 token 消耗达 3.2 千万亿;Omni 转向多模态生成;AI 搜索从「找网页」变为「找结果」;Android XR 与智能眼镜探索新入口;AI Studio 支持自然语言开发 Android App。 2026-05-20 🔭 科技见闻 2
中国算力平台(北京)上线 算力网跻身国家级基础设施 中国算力平台(北京)5月15日正式上线,已具备算力态势感知监测与供需匹配功能。国务院常务会议近期将算力网与水、电等公共基础设施置于同等位置,国投证券研报指建设国家算力网将带动国产算力产业链快速发展,紫光股份、浪潮信息等本土厂商已推出相关产品。 2026-05-20 🔭 科技见闻 2
谷歌发布Gemini 3.5系列 Omni视频生成实现可交互突破 谷歌在Google I/O大会上发布Gemini 3.5系列模型,轻量级的Flash成本仅为同类模型一半至三分之一,将作为默认模型;重量级Pro预计下月开放。同时推出世界模型Gemini Omni,可生成并交互视频;智能体Gemini Spark下周开放测试。 2026-05-20 🔭 科技见闻 0
谷歌I/O发布搜索框25年最大升级 AI编程工具视频模型齐出 谷歌I/O大会发布搜索框25年来最大升级及多项AI新品,包括Gemini 3.5 Flash编程模型、Antigravity开发平台和Omni多模态生成模型。搜索将加入代理功能,9亿月活用户同比翻倍。付费订阅100美元/月,AI视频将加强Deepfake标注。 2026-05-20 🔭 科技见闻 3
伊朗战争重击AI底层供应链 氦气短缺Cost全面攀升 伊朗战争持续冲击AI供应链。卡塔尔氦气出口受阻,全球供应占比超30%的关键材料告急;能源、运费成本升至历史高位,台积电、富士康、英飞凌等芯片厂商预警盈利能力承压。IDC与William Blair分析师均警告,当前冲击或仅为开端,若霍尔木兹海峡封锁持续,后续影响或进一步扩大。 2026-05-20 🔭 科技见闻 2