大会以“好用、易用、愿用——以突破性创新加速AI赋能千行百业”为主题,设置“1+9”总体结构,即1个开幕式(主论坛)、9个分论坛,聚焦人工智能前沿技术与产业发展。
近日,AI 工程师和技术作家 Andriy Burkov 发布了一份「从头开始写 GRPO 代码」的教程,其中介绍了如何基于 Qwen2.5-1.5B-Instruct 模型构建一个使用 GRPO 的分布式强化学习流程。
DeepSeek 官方在知乎发布《DeepSeek-V3 / R1 推理系统概览》一文,详细介绍如何使用大规模跨节点专家并行(Expert Parallelism / EP)来增大 batch size,如何隐藏传输的耗时,如何进行负载均衡。
2月28日消息,今日,DeepSeek开源周第五天,也是最后一天,亮出的是3FS,一种高性能并行文件系统。3FS(Fire-Flyer File System)专为充分利用现代固态硬盘(SSD)和远程直接内存访问(RDMA)网络的带宽而设计,能够加速对数据存储和访问。
近日,零一万物CE0兼创新工场董事长李开复出席了一项目合作大会并发表了主题演讲。在演讲中,李开复从技术演进的角度深入剖析了AI爆发式增长的动力。他回顾了人类历史上的两次IT革命——PC时代和移动互联网时代,指出这两个时代都极大地推动了全球GDP的增长。
在数智化转型的浪潮中,人工智能技术正以迅猛之势重塑着各个行业的格局。「太擎」以破局者的姿态,正式宣布其核心产品“问答引擎”已深度接入DeepSeek系列模型(DeepSeek-R1、DeepSeek-V3)。通过接入DeepSeek系列模型,「太擎」的问答引擎实现了知识推理问答能力的全面升级。
开源模型,还是得看杭州。前脚发完QwQ-Max,阿里就在深夜开源了视频生成模型Wan 2.1,14B参数直接屠榜VBench,什么Sora、Gen-3通通不是它的对手。
DeepEP, 第一个用于MoE模型训练和推理的开源EP通信库(expert parallelism,专家并行)。它提供高吞吐量和低延迟的all-to-all GPU内核,也称为MoE dispatch和combine。
AI应用破圈,踢球、面试、做家务轻松拿捏;AI企业出海,海外企业和个人客户买买买;AI性能跃升,产品价格与能力飞速迭代……2月21日至23日,2025全球开发者先锋大会在上海举办,数万名开发者与领军企业聚在一起,见证人工智能朝着全民化、国际化、加速化三大趋势演进。
共12页,111条内容